شماره ركورد
33705
پديد آورنده
ابراهيم حدادي
عنوان
تشخص احساسات از روي متن با استفاده از پردازش زبان طبيعي ،يادگيري عميق ومدل هاي پيش آموزش داده شده.
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر
سال تحصيل
1402
تاريخ دفاع
1404/06/24
استاد راهنما
جواد وحيدي
استاد مشاور
جواد وحيدي
دانشكده
نور
چكيده
پيشينه: تشخيص احساسات از روي متن يكي از شاخههاي كليدي پردازش زبان طبيعي (NLP) است كه به شناسايي حالات عاطفي مانند شادي، غم، خشم و هيجان در متون، بهويژه در شبكههاي اجتماعي، ميپردازد. اين فرآيند در تحليل نظرات مشتريان، پايش سلامت روان و توسعه چتباتهاي هوشمند كاربرد دارد. زبان فارسي به دليل غناي صرفي، كمبود دادههاي برچسبدار و تنوع زباني، چالشهاي خاصي در اين حوزه دارد.
پيشرفتهاي اخير در يادگيري عميق و مدلهاي پيشآموزشديده مانند Pars BERT امكان بهبود عملكرد در تحليل احساسات متون فارسي را فراهم كرده است.
اهداف: اين پژوهش با هدف بررسي و مقايسه عملكرد مدلهاي يادگيري ماشين (SVM)، يادگيري عميق (LSTM) و مدلهاي پيشآموزشديده (Pars BERT) در تشخيص احساسات توييتهاي فارسي انجام شد. اهداف شامل ارزيابي تأثير پيشپردازش متون فارسي، مقايسه دقت و كارايي مدلها، و تحليل هزينه محاسباتي آنها بود.
روشها: يك ديتاست اختصاصي از توييتهاي فارسي استخراجشده از پلتفرم X با برچسبهاي احساسي (خوشحال، ناراحت، عصباني، هيجانزده) جمعآوري شد. دادهها با استفاده از نرمالسازي، توكنسازي، حذف كلمات توقف و ريشهيابي پيشپردازش شدند. سه مدل پيادهسازي شدند: ماشين بردار پشتيبان (SVM) با ويژگيهاي TF-IDF، شبكه عصبي بازگشتي LSTM با كلمهبرداري، و مدل Pars BERT با ريزتنظيم. معيارهاي ارزيابي شامل دقت (Accuracy) و امتياز F1 (F1-Score) بودند.
نتايج: نتايج نشان داد كه مدل Pars BERT با دقت 0.97 و F1-Score 0.95 بهطور چشمگيري عملكرد بهتري نسبت به SVM و LSTM (با دقت حدود 0.70) دارد. SVM در مقايسه با LSTM به دليل مديريت بهتر عدم توازن كلاسها، اندكي عملكرد بهتري نشان داد. پيشپردازش متون فارسي، بهويژه نرمالسازي و حذف كلمات توقف، نقش مهمي در بهبود عملكرد مدلها ايفا كرد.
نتيجهگيري: مدلهاي پيشآموزشديده مانند Pars BERT به دليل درك بافتمحور و توانايي يادگيري از دادههاي گسترده، بهترين انتخاب براي تشخيص احساسات در متون فارسي هستند. با اين حال، هزينه محاسباتي بالاي اين مدلها چالشي براي كاربردهاي عملي است. پيشنهاد ميشود در تحقيقات آينده، مدلهاي تركيبي و بهينهسازيشده براي دستگاههاي كممنبع بررسي شوند و ديتاستهاي متنوعتري براي بهبود تعميمپذيري مدلها استفاده گردد.
تاريخ ورود اطلاعات
1404/06/29
عنوان به انگليسي
Sentiment Analysis from Text Using Natural Language Processing, Deep Learning, and Pre-trained Models
تاريخ بهره برداري
9/15/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
ابراهيم حدادي
چكيده به لاتين
Background: Emotion recognition from text is a key branch of Natural Language Processing (NLP) that focuses on identifying emotional states such as happiness, sadness, anger, and excitement in textual content, particularly in social media. This process has applications in customer sentiment analysis, mental health monitoring, and intelligent chatbot development. The Persian language presents unique challenges in this domain due to its rich morphology, lack of labeled data, and linguistic diversity. Recent advances in deep learning and pre-trained models such as ParsBERT have enabled improved performance in analyzing emotions in Persian texts.
Objectives: This research aimed to investigate and compare the performance of machine learning (SVM), deep learning (LSTM), and pre-trained models (ParsBERT) in recognizing emotions from Persian tweets. The objectives included evaluating the impact of Persian text preprocessing, comparing the accuracy and efficiency of models, and analyzing their computational costs.
Methods: A custom dataset of Persian tweets extracted from platform X was collected with emotional labels (happy, sad, angry, excited). The data was preprocessed using normalization, tokenization, stop word removal, and stemming. Three models were implemented: Support Vector Machine (SVM) with TF-IDF features, Long Short-Term Memory (LSTM) network with word embeddings, and ParsBERT with fine-tuning. evaluation metrics included Accuracy and F1-Score.
Results: The results demonstrated that ParsBERT achieved significantly superior performance with 0.97 accuracy and 0.95 F1-Score compared to SVM and LSTM (both with approximately 0.70 accuracy). SVM showed slightly better performance than LSTM due to better handling of class imbalance. Persian text preprocessing, particularly normalization and stop word removal, played a crucial role in improving model performance.
Conclusions: Pre-trained models like ParsBERT represent the optimal choice for emotion recognition in Persian texts due to their contextual understanding and ability to learn from extensive data. However, their high computational cost poses a challenge for practical applications. Future research should explore hybrid and optimized models for resource-constrained devices and utilize more diverse datasets to improve model generalizability.
كليدواژه هاي فارسي
: تشخيص احساسات , پردازش زبان طبيعي , يادگيري عميق , پارس برت , توييتهاي فارسي
كليدواژه هاي لاتين
Emotion Recognition , , Natural Language Processing , Deep Learning , Pars BERT , Persian tweets
Author
Ebrahim Hadadi
SuperVisor
Javad Vahidi