-
شماره ركورد
26498
-
پديد آورنده
سعيده نيك سيرت اقدم
-
عنوان
ارائه الگوريتمي براي برچسبزني نقش معنايي و كاربست آن در زبان فارسي مبتني بر يادگيري عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامييوتر گرايش نرم افزار
-
سال تحصيل
1397
-
تاريخ دفاع
1400/11/30
-
استاد راهنما
جناب آقاي دكتر بهروز مينايي بيدگلي
-
دانشكده
مهندسي كامپيوتر
-
چكيده
يكي از اساسيترين مباحث مورد بحث در پردازش زبان طبيعي، تشخيص اجزاي جمله و ارتباط آنها با موضوع جمله و توانايي پاسخ به سئوالاتي نظير اينكه «چه كسي، چه عملي را، روي چه چيزي و در چه زمان و مكاني، چرا و چگونه انجام داده است» ميباشد. اين فرايند، برچسبزني نقش معنايي ناميده ميشود. براي حل اين مسئله روشها و الگوريتمهاي مختلفي از جمله روشهاي مبتني بر قاعده و روشهاي مبتني بر يادگيري عميق ارائه شده است. روشهاي مبتني بر قاعده عمدتاً تك زباني هستند و به دليل وابستگي به قواعد زبان قابليت استفاده در زبانهاي ديگر را ندارند همچنين با توجه به نياز آنها به استفاده از ويژگيهاي كمكي مانند اطلاعات اجزاي سخن و اطلاعات تجزيهنحوي علاوه بر برچسبهاي اصلي، داراي سربار هزينهاي بيشتري هستند. بهرهگيري از روشهاي يادگيري عميق در حل اين مسئله، موجب بهبودهاي قابل توجهي نتايج شدند. البته اين بهبودها برحسب الگوريتم به كارگرفته شده در تبديل متون به فضاي برداري، تعداد لايههاي شبكه عصبي و نوع شبكه عصبي و تزريق يا عدم تزريق ويژگيهاي كمكي به شبكه متفاوت هستند. در اين پژوهش، الگوريتمي مبتني بر يادگيري عميق و كاربست آن در زبان فارسي ضمن بهرهگيري از بازنماي بافتاري در لايه تبديل متون به فضاي برداري ارائه شده است كه روي پيكره نقشهاي معنايي زبان فارسي با حدود 30 هزار جمله آموزش و آزمون شده است. اين روش در مقايسه با نتايج گزارش شده قبلي در مرز دانش فارسي، كه از ويژگيهاي كمكي علاوه بر برچسبهاي نهايي استفاده ميكنند، بدون استفاده از ساير ويژگيها به دقت 86.13% روي سنجه F1 رسيده است. اين در حالي است كه در روشهاي قبلي در صورت عدم استفاده از ويژگيهاي كمكي، ميزان دقت 68.75% بوده است. همچنين مقدمات ساخت پيكره منطبق با ساختار فريمنت در اين پژوهش فراهم گرديده است.
-
تاريخ ورود اطلاعات
1401/02/31
-
عنوان به انگليسي
Introducing an Algorithm for Semantic Role Labeling Based on Deep Learning and its Application in Persian
-
تاريخ بهره برداري
2/19/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سعيده نيك سيرت اقدم
-
چكيده به لاتين
Increasing the data on the internet in recent years, and transformation of the web to one of the largest and valuable data sources in one hand, and on the other hand generation of the vast volume of the data in the form of natural language, shows the importance of developing natural language processing capability. Semantic role labeling (SRL) as a task in natural language processing is a process to determine “who” did “what” to “whom”, “when”, “where”, “how”, and “why” in a sentence. SRL can help lots of natural language processing applications, such as information extraction, text summarization, and machine translation.
Our proposed method in this research is to provide an algorithm for Semantic Role Labeling based on deep learning and its application in Persian. We used the BERT language model and encountered the problem as a Token Classification task. We fine-tuned the ParsBERT model only passing the tokens, labels and also identifying the index of the predicate in the sentence. The result obtained in this study with the evaluation criterion of F1 is 86.13%, which is better than the results of previous methods based on other embedding approaches such as Word2Vec, and this shows that good and acceptable results can be obtained without using syntactic information or any other extra information.
-
كليدواژه هاي فارسي
برچسب زني نقش معنايي , پردازش زبان طبيعي , يادگيري عميق , فريم نت , متن كاوي
-
كليدواژه هاي لاتين
Semantic Role Labeling , Natural Language Processing , Deep Learning , BERT , FrameNet , Text mining
-
Author
Saeideh Niksirat Aghdam
-
SuperVisor
Dr. Behrouz Minaei Bidgoli
-
لينک به اين مدرک :