ابراهيم حدادي

عنوان

تشخص احساسات از روي متن با استفاده از پردازش زبان طبيعي ،يادگيري عميق ومدل هاي پيش آموزش داده شده.

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي كامپيوتر

سال تحصيل

1402

تاريخ دفاع

1404/06/24

استاد راهنما

جواد وحيدي

استاد مشاور

جواد وحيدي

دانشكده

نور

چكيده

پيشينه: تشخيص احساسات از روي متن يكي از شاخه‌هاي كليدي پردازش زبان طبيعي (NLP) است كه به شناسايي حالات عاطفي مانند شادي، غم، خشم و هيجان در متون، به‌ويژه در شبكه‌هاي اجتماعي، مي‌پردازد. اين فرآيند در تحليل نظرات مشتريان، پايش سلامت روان و توسعه چت‌بات‌هاي هوشمند كاربرد دارد. زبان فارسي به دليل غناي صرفي، كمبود داده‌هاي برچسب‌دار و تنوع زباني، چالش‌هاي خاصي در اين حوزه دارد. پيشرفت‌هاي اخير در يادگيري عميق و مدل‌هاي پيش‌آموزش‌ديده مانند Pars BERT امكان بهبود عملكرد در تحليل احساسات متون فارسي را فراهم كرده است. اهداف: اين پژوهش با هدف بررسي و مقايسه عملكرد مدل‌هاي يادگيري ماشين (SVM)، يادگيري عميق (LSTM) و مدل‌هاي پيش‌آموزش‌ديده (Pars BERT) در تشخيص احساسات توييت‌هاي فارسي انجام شد. اهداف شامل ارزيابي تأثير پيش‌پردازش متون فارسي، مقايسه دقت و كارايي مدل‌ها، و تحليل هزينه محاسباتي آن‌ها بود. روش‌ها: يك ديتاست اختصاصي از توييت‌هاي فارسي استخراج‌شده از پلتفرم X با برچسب‌هاي احساسي (خوشحال، ناراحت، عصباني، هيجان‌زده) جمع‌آوري شد. داده‌ها با استفاده از نرمال‌سازي، توكن‌سازي، حذف كلمات توقف و ريشه‌يابي پيش‌پردازش شدند. سه مدل پياده‌سازي شدند: ماشين بردار پشتيبان (SVM) با ويژگي‌هاي TF-IDF، شبكه عصبي بازگشتي LSTM با كلمه‌برداري، و مدل Pars BERT با ريزتنظيم. معيارهاي ارزيابي شامل دقت (Accuracy) و امتياز F1 (F1-Score) بودند. نتايج: نتايج نشان داد كه مدل Pars BERT با دقت 0.97 و F1-Score 0.95 به‌طور چشمگيري عملكرد بهتري نسبت به SVM و LSTM (با دقت حدود 0.70) دارد. SVM در مقايسه با LSTM به دليل مديريت بهتر عدم توازن كلاس‌ها، اندكي عملكرد بهتري نشان داد. پيش‌پردازش متون فارسي، به‌ويژه نرمال‌سازي و حذف كلمات توقف، نقش مهمي در بهبود عملكرد مدل‌ها ايفا كرد. نتيجه‌گيري: مدل‌هاي پيش‌آموزش‌ديده مانند Pars BERT به دليل درك بافت‌محور و توانايي يادگيري از داده‌هاي گسترده، بهترين انتخاب براي تشخيص احساسات در متون فارسي هستند. با اين حال، هزينه محاسباتي بالاي اين مدل‌ها چالشي براي كاربردهاي عملي است. پيشنهاد مي‌شود در تحقيقات آينده، مدل‌هاي تركيبي و بهينه‌سازي‌شده براي دستگاه‌هاي كم‌منبع بررسي شوند و ديتاست‌هاي متنوع‌تري براي بهبود تعميم‌پذيري مدل‌ها استفاده گردد.

تاريخ ورود اطلاعات

1404/06/29

عنوان به انگليسي

Sentiment Analysis from Text Using Natural Language Processing, Deep Learning, an‎d Pre-trained Models

تاريخ بهره برداري

9/15/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

ابراهيم حدادي

Name: ابراهيم حدادي
Author: ابراهيم حدادي

چكيده به لاتين

Background: Emotion recognition from text is a key branch of Natural Language Processing (NLP) that focuses on identifying emotional states such as happiness, sadness, anger, an‎d excitement in textual content, particularly in social media. This process has applications in customer sentiment analysis, mental health monitoring, an‎d intelligent chatbot development. The Persian language presents unique challenges in this domain due to its rich morphology, lack of labeled data, an‎d linguistic diversity. Recent advances in deep learning an‎d pre-trained models such as ParsBERT have enabled improved performance in analyzing emotions in Persian texts. Objectives: This research aimed to investigate an‎d compare the performance of machine learning (SVM), deep learning (LSTM), an‎d pre-trained models (ParsBERT) in recognizing emotions from Persian tweets. The objectives included eva‎luating the impact of Persian text preprocessing, comparing the accuracy an‎d efficiency of models, an‎d analyzing their computational costs. Methods: A custom dataset of Persian tweets extracted from platform X was collected with emotional labels (happy, sad, angry, excited). The data was preprocessed using normalization, tokenization, stop word removal, an‎d stemming. Three models were implemented: Support Vector Machine (SVM) with TF-IDF features, Long Short-Term Memory (LSTM) network with word embeddings, an‎d ParsBERT with fine-tuning. eva‎luation metrics included Accuracy an‎d F1-Score. Results: The results demonstrated that ParsBERT achieved significantly superior performance with 0.97 accuracy an‎d 0.95 F1-Score compared to SVM an‎d LSTM (both with approximately 0.70 accuracy). SVM showed slightly better performance than LSTM due to better han‎dling of class imbalance. Persian text preprocessing, particularly normalization an‎d stop word removal, played a crucial role in improving model performance. Conclusions: Pre-trained models like ParsBERT represent the optimal choice for emotion recognition in Persian texts due to their contextual understan‎ding an‎d ability to learn from extensive data. However, their high computational cost poses a challenge for practical applications. Future research should explore hybrid an‎d optimized models for resource-constrained devices an‎d utilize more diverse datasets to improve model generalizability.

كليدواژه هاي فارسي

: تشخيص احساسات , پردازش زبان طبيعي , يادگيري عميق , پارس برت , توييت‌هاي فارسي

كليدواژه هاي لاتين

Emotion Recognition , , Natural Language Processing , Deep Learning , Pars BERT , Persian tweets

Author

Ebrahim Hadadi

SuperVisor

Javad Vahidi

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=33705&Field=0&DTC=6