• شماره ركورد
    33650
  • پديد آورنده

    صبا اسمعيلي ريكنده اي

  • عنوان
    تجزيه و تحليل آرا مبتني بر ويژگي در حوزه‌ي نظرات كاربران
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر - نرم افزار
  • سال تحصيل
    1400
  • تاريخ دفاع
    1404/01/25
  • استاد راهنما
    دكتر بهروز مينايي
  • استاد مشاور
    ندارم
  • دانشكده
    كامپيوتر
  • چكيده
    تجزيه و تحليل آرا مبتني بر ويژگي يكي از وظايف در حوزه‌ي پردازش زبان طبيعي است كه هدف آن شناسايي جنبه‌هاي مختلف در متن و تعيين نوع احساس نسبت به هر جنبه به‌صورت مجزا مي‌باشد. با اين حال، اجراي اين تحليل در زبان‌هاي كم‌منبعي مانند فارسي با موانعي همچون كمبود منابع داده، پيچيدگي‌هاي نحوي و نبود مدل‌هاي كارآمد روبه‌روست. يكي از چالش‌هاي اساسي در اين زمينه، انتقال دقيق احساسات و جنبه‌هاي زباني در فرآيند ترجمه ميان زبان‌هاست، به‌ويژه زماني كه مدل‌هاي تحليل احساسات بر پايه‌ي زبان انگليسي طراحي شده‌اند. اين پژوهش با هدف بهبود عملكرد تحليل احساسات در زبان فارسي، رويكردي بين‌زباني مبتني بر ترجمه‌ي داده‌ها و بهره‌گيري از مدل‌هاي چندزبانه ارائه مي‌دهد. بدين منظور، مجموعه‌داده‌ي فارسي parsABSA به انگليسي ترجمه و با داده‌هاي استاندارد Semeva‎l ادغام شده است. سپس با بهره‌گيري از مدل‌هاي چندزبانه مانند DeBERTa و DeepSeek R1، فرايند استخراج جنبه‌ها و تشخيص احساسات به‌صورت هم‌زمان و دقيق انجام شده است. مدل پيشنهادي با استفاده از معماري تركيبي و سازوكار رأي‌گيري و بهره‌گيري از برچسب‌گذاري BIO توسعه‌يافته موجب افزايش دقت در تشخيص مرزهاي معنايي شده است. نتايج ارزيابي نشان مي‌دهد كه مدل پيشنهادي در مقايسه با روش‌هاي پايه، در هر دو زبان فارسي و انگليسي عملكرد بهتري دارد. اين يافته‌ها نشان مي‌دهند كه استفاده‌ي هدفمند از ترجمه در كنار مدل‌هاي چندزبانه نه‌تنها موجب بهبود تحليل احساسات در زبان‌هاي كم‌منبع مي‌شود، بلكه قابليت تعميم‌پذيري به ساير زبان‌هاي مشابه فارسي را نيز داراست.
  • تاريخ ورود اطلاعات
    1404/06/26
  • عنوان به انگليسي
    Aspect-based sentiment analysis in the field of user’s opinions
  • تاريخ بهره برداري
    4/14/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    صبا اسمعيلي ريكنده اي

  • چكيده به لاتين
    Aspect-Based Sentiment Analysis (ABSA) is one of the key tasks in the field of Natural Language Processing (NLP), aiming to identify different aspects in a text an‎d determine the sentiment type toward each aspect separately. However, performing this analysis in low-resource languages such as Persian faces challenges including data scarcity, syntactic complexity, an‎d the lack of efficient models. One of the fundamental challenges in this context is the accurate transfer of sentiments an‎d linguistic aspects during cross-lingual translation, especially when sentiment analysis models are primarily designed for English. This research aims to improve sentiment analysis performance in Persian through a cross-lingual approach based on data translation an‎d the utilization of multilingual models. For this purpose, the Persian dataset parsABSA was translated into English an‎d integrated with the stan‎dard Semeva‎l dataset. Subsequently, by leveraging multilingual models such as DeBERTa an‎d DeepSeek R1, the processes of aspect extraction an‎d sentiment classification were performed simultaneously an‎d with higher precision. The proposed model, developed through a hybrid architecture, a voting mechanism, an‎d the use of the BIO tagging scheme, has enhanced accuracy in identifying semantic boundaries. eva‎luation results indicate that the proposed model outperforms baseline methods in both Persian an‎d English. These findings demonstrate that purposeful use of translation alongside multilingual models not only improves sentiment analysis in low-resource languages but also provides generalizability to other languages similar to Persian.
  • كليدواژه هاي فارسي
    تجزيه و تحليل آرا مبتني بر ويژگي , زبان‌هاي كم منبع , يادگيري بين‌زباني , ترجمه ماشيني
  • كليدواژه هاي لاتين
    Aspect-Based Sentiment Analysis , Low-Resource Languages , Cross-Lingual Learning , Machine Translation
  • Author
    Saba Esmaili
  • SuperVisor
    Dr. Behrooz Minaei