شماره ركورد
33650
پديد آورنده
صبا اسمعيلي ريكنده اي
عنوان
تجزيه و تحليل آرا مبتني بر ويژگي در حوزهي نظرات كاربران
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
سال تحصيل
1400
تاريخ دفاع
1404/01/25
استاد راهنما
دكتر بهروز مينايي
استاد مشاور
ندارم
دانشكده
كامپيوتر
چكيده
تجزيه و تحليل آرا مبتني بر ويژگي يكي از وظايف در حوزهي پردازش زبان طبيعي است كه هدف آن شناسايي جنبههاي مختلف در متن و تعيين نوع احساس نسبت به هر جنبه بهصورت مجزا ميباشد. با اين حال، اجراي اين تحليل در زبانهاي كممنبعي مانند فارسي با موانعي همچون كمبود منابع داده، پيچيدگيهاي نحوي و نبود مدلهاي كارآمد روبهروست. يكي از چالشهاي اساسي در اين زمينه، انتقال دقيق احساسات و جنبههاي زباني در فرآيند ترجمه ميان زبانهاست، بهويژه زماني كه مدلهاي تحليل احساسات بر پايهي زبان انگليسي طراحي شدهاند.
اين پژوهش با هدف بهبود عملكرد تحليل احساسات در زبان فارسي، رويكردي بينزباني مبتني بر ترجمهي دادهها و بهرهگيري از مدلهاي چندزبانه ارائه ميدهد. بدين منظور، مجموعهدادهي فارسي parsABSA به انگليسي ترجمه و با دادههاي استاندارد Semeval ادغام شده است. سپس با بهرهگيري از مدلهاي چندزبانه مانند DeBERTa و DeepSeek R1، فرايند استخراج جنبهها و تشخيص احساسات بهصورت همزمان و دقيق انجام شده است. مدل پيشنهادي با استفاده از معماري تركيبي و سازوكار رأيگيري و بهرهگيري از برچسبگذاري BIO توسعهيافته موجب افزايش دقت در تشخيص مرزهاي معنايي شده است.
نتايج ارزيابي نشان ميدهد كه مدل پيشنهادي در مقايسه با روشهاي پايه، در هر دو زبان فارسي و انگليسي عملكرد بهتري دارد. اين يافتهها نشان ميدهند كه استفادهي هدفمند از ترجمه در كنار مدلهاي چندزبانه نهتنها موجب بهبود تحليل احساسات در زبانهاي كممنبع ميشود، بلكه قابليت تعميمپذيري به ساير زبانهاي مشابه فارسي را نيز داراست.
تاريخ ورود اطلاعات
1404/06/26
عنوان به انگليسي
Aspect-based sentiment analysis in the field of user’s opinions
تاريخ بهره برداري
4/14/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
صبا اسمعيلي ريكنده اي
چكيده به لاتين
Aspect-Based Sentiment Analysis (ABSA) is one of the key tasks in the field of Natural Language Processing (NLP), aiming to identify different aspects in a text and determine the sentiment type toward each aspect separately. However, performing this analysis in low-resource languages such as Persian faces challenges including data scarcity, syntactic complexity, and the lack of efficient models. One of the fundamental challenges in this context is the accurate transfer of sentiments and linguistic aspects during cross-lingual translation, especially when sentiment analysis models are primarily designed for English.
This research aims to improve sentiment analysis performance in Persian through a cross-lingual approach based on data translation and the utilization of multilingual models. For this purpose, the Persian dataset parsABSA was translated into English and integrated with the standard Semeval dataset. Subsequently, by leveraging multilingual models such as DeBERTa and DeepSeek R1, the processes of aspect extraction and sentiment classification were performed simultaneously and with higher precision. The proposed model, developed through a hybrid architecture, a voting mechanism, and the use of the BIO tagging scheme, has enhanced accuracy in identifying semantic boundaries.
evaluation results indicate that the proposed model outperforms baseline methods in both Persian and English. These findings demonstrate that purposeful use of translation alongside multilingual models not only improves sentiment analysis in low-resource languages but also provides generalizability to other languages similar to Persian.
كليدواژه هاي فارسي
تجزيه و تحليل آرا مبتني بر ويژگي , زبانهاي كم منبع , يادگيري بينزباني , ترجمه ماشيني
كليدواژه هاي لاتين
Aspect-Based Sentiment Analysis , Low-Resource Languages , Cross-Lingual Learning , Machine Translation
Author
Saba Esmaili
SuperVisor
Dr. Behrooz Minaei