• شماره ركورد
    26498
  • پديد آورنده

    سعيده نيك سيرت اقدم

  • عنوان
    ارائه الگوريتمي براي برچسب‌زني نقش معنايي و كاربست آن در زبان فارسي مبتني بر يادگيري عميق
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامييوتر گرايش نرم افزار
  • سال تحصيل
    1397
  • تاريخ دفاع
    1400/11/30
  • استاد راهنما
    جناب آقاي دكتر بهروز مينايي بيدگلي
  • دانشكده
    مهندسي كامپيوتر
  • چكيده
    يكي از اساسي‌ترين مباحث مورد بحث در پردازش زبان طبيعي، تشخيص اجزاي جمله و ارتباط آنها با موضوع جمله و توانايي پاسخ به سئوالاتي نظير اينكه «چه كسي، چه عملي را، روي چه چيزي و در چه زمان و مكاني، چرا و چگونه انجام داده است» مي‌باشد. اين فرايند، برچسب‌زني نقش معنايي ناميده مي‌شود. براي حل اين مسئله روش‌ها و الگوريتم‌هاي مختلفي از جمله روش‌هاي مبتني بر قاعده و روش‌هاي مبتني بر يادگيري عميق ارائه شده است. روش‌هاي مبتني بر قاعده عمدتاً تك زباني هستند و به دليل وابستگي به قواعد زبان قابليت استفاده در زبانهاي ديگر را ندارند همچنين با توجه به نياز آنها به استفاده از ويژگي‌هاي كمكي مانند اطلاعات اجزاي سخن و اطلاعات تجزيه‌نحوي علاوه بر برچسب‌هاي اصلي، داراي سربار هزينه‌اي بيشتري هستند. بهره‌گيري از روش‌هاي يادگيري عميق در حل اين مسئله، موجب بهبودهاي قابل توجهي نتايج شدند. البته اين بهبودها برحسب الگوريتم به كارگرفته شده در تبديل متون به فضاي برداري، تعداد لايه‌هاي شبكه عصبي و نوع شبكه عصبي و تزريق يا عدم تزريق ويژگي‌هاي كمكي به شبكه متفاوت هستند. در اين پژوهش، الگوريتمي مبتني بر يادگيري عميق و كاربست آن در زبان فارسي ضمن بهره‌گيري از بازنماي بافتاري در لايه تبديل متون به فضاي برداري ارائه شده است كه روي پيكره نقش‌هاي معنايي زبان فارسي با حدود 30 هزار جمله‌ آموزش و آزمون شده است. اين روش در مقايسه با نتايج گزارش شده قبلي در مرز دانش فارسي، كه از ويژگي‌هاي كمكي علاوه بر برچسب‌هاي نهايي استفاده مي‌كنند، بدون استفاده از ساير ويژگي‌ها به دقت 86.13% روي سنجه F1 رسيده است. اين در حالي است كه در روش‌هاي قبلي در صورت عدم استفاده از ويژگي‌هاي كمكي، ميزان دقت 68.75% بوده است. همچنين مقدمات ساخت پيكره منطبق با ساختار فريم‌نت در اين پژوهش فراهم گرديده است.
  • تاريخ ورود اطلاعات
    1401/02/31
  • عنوان به انگليسي
    Introducing an Algorithm for Semantic Role Labeling Based on Deep Learning and its Application in Persian
  • تاريخ بهره برداري
    2/19/2023 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    سعيده نيك سيرت اقدم

  • چكيده به لاتين
    Increasing the data on the internet in recent years, and transformation of the web to one of the largest and valuable data sources in one hand, and on the other hand generation of the vast volume of the data in the form of natural language, shows the importance of developing natural language processing capability. Semantic role labeling (SRL) as a task in natural language processing is a process to determine “who” did “what” to “whom”, “when”, “where”, “how”, and “why” in a sentence. SRL can help lots of natural language processing applications, such as information extraction, text summarization, and machine translation. Our proposed method in this research is to provide an algorithm for Semantic Role Labeling based on deep learning and its application in Persian. We used the BERT language model and encountered the problem as a Token Classification task. We fine-tuned the ParsBERT model only passing the tokens, labels and also identifying the index of the predicate in the sentence. The result obtained in this study with the eva‎luation criterion of F1 is 86.13%, which is better than the results of previous methods based on other embedding approaches such as Word2Vec, and this shows that good and acceptable results can be obtained without using syntactic information or any other extra information.
  • كليدواژه هاي فارسي
    برچسب زني نقش معنايي , پردازش زبان طبيعي , يادگيري عميق , فريم نت , متن كاوي
  • كليدواژه هاي لاتين
    Semantic Role Labeling , Natural Language Processing , Deep Learning , BERT , FrameNet , Text mining
  • Author
    Saeideh Niksirat Aghdam
  • SuperVisor
    Dr. Behrouz Minaei Bidgoli