مسعود اميني مطلق

عنوان

تحليل احساسات در داده هاي شبكه هاي اجتماعي از طريق روش هاي داده كاوي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي برق

تاريخ دفاع

1400/9/8

استاد راهنما

دكتر هادي شهريار شاه حسيني

دانشكده

مهندسي برق

چكيده

شبكه‌هاي اجتماعي محيطي هستند كه كاربران احساس و عقايد روزمره خود را در آنها به اشتراك مي‌گذارند. متن همچنان به عنوان يكي از پركاربردترين روش‌ها براي ارتباط در شبكه‌هاي اجتماعي به حساب مي‌آيد و از آن براي بيان احساسات و عقايد استفاده مي‌شود. تحليل احساسات روشي براي تشخيص و شناسايي احساسات عقايد و نظرات از متن داده‌هاي نوشته شده در شبكه‌هاي اجتماعي مي‌باشد. داده‌كاوي به عنوان يكي از روش‌هاي كاربردي براي استخراج و تحليل اين داده‌ها به حساب مي‌آيد. در اين پروژه ما از چهار روش دسته‌بندي در داده‌كاوي كه بيشترين كاربرد را در اين زمينه دارند، استفاده كرديم. اين چهار روش دوبار روي مجموعه داده استخراج شده از شبكه‌هاي اجتماعي اعمال شد؛ ابتدا روي داده‌ها با دو ويژگي مثبت و منفي و سپس روي داده‌ها با سه ويژگي مثبت، منفي و خنثي. افزون بر اين روش‌ها، ما از دو روش تجميعي نيز براي مدل‌سازي و طبقه‌بندي بهره برديم. همچنين مجموعه داده را به دو دسته آموزشي و آزمايشي با نسبت هاي مختلف تقسيم كرديم. نتايج بدست آمده نشان مي‌دهد با روش استفاده شده در اين پروژه، طبقه‌بند ماشين بردار پشتيبان (SVM) در ميان طبقه‌بندهاي ديگر نتايج بهتري را ارائه مي‌دهد. روش SVM در دسته‌بندي دوتايي 3/53 % و در دسته‌بندي سه‌تايي 7/41 % دقت بيشتري نسبت به روش‌هاي ديگر ارائه داده است. همچنين روش ارائه شده در اين پايان‌نامه نسبت به منابع ديگر در معيار دقت، 3/52 % در دسته‌بندي دوتايي و 5/91 % در دسته‌بندي سه‌تايي بهبود داشته است؛ اين بهبود در شرايطي است كه در اين پروژه تقسيم داده‌هاي آموزشي و داده‌هاي آزماشي از طريق روش K-Fold Cross Validation انجام شده است. همچنين نتايج نشان مي‌دهد استفاده از 50 % داده‌ها به عنوان داده آموزشي، نتايج تقريبا يكساني با نسبت 70 % دارد؛ در حاليكه استفاده از روش K-Fold Cross Validation با K=10 مي‌تواند نتايج بهتري را ارائه دهد.

تاريخ ورود اطلاعات

1400/12/18

عنوان به انگليسي

Sentiment Analysis of Social Media Data through Data Mining Techniques

تاريخ بهره برداري

11/29/2022 12:00:00 AM

دانشجوي وارد كننده اطلاعات

مسعود اميني مطلق

Name: مسعود اميني مطلق
Author: مسعود اميني مطلق

چكيده به لاتين

Social networks represent an established environment in which users share their daily emotions and opinions. Text is still one of the most common ways of communication in a social network, since users utilize it to express their opinions and emotions on various and diverse topics. Sentiment Analysis (SA) is an approach to identify sentiments of the opinions from the text of social media data. Data mining is considered as one of the practical methods for extracting and analyzing this data. In this article we apply four widely used data mining classifiers on one dataset twice. First, on binomial (positive and negative) data and second, on polynomial (positive, negative and neutral) data to analyze the sentiment of texts. Furthermore, we utilize two ensemble methods in order to classify the texts. We also devided the dataset to training set and testing set with different percentages. Our results shows that Support Vector Machine (SVM) demonstrates a better accuracy compared to other machine learning algorithms with improvements of 3.53% on binomial and 7.41% on polynomial dataset. Results also demonstrate that accuracy has improved 3.52% on binomial and 5.91% on polynomial classification compared to other references. This improvement is in the context that we used the training and testing data were divided through the K-Fold Cross Validation method. Results also demonstrate that using 50% of the dataset as training data has almost the same results as 70%; while using 10-Fold Cross Validation can reach better results.

كليدواژه هاي فارسي

داده كاوي , تحليل احساسات , متن كاوي , شبكه اجتماعي , كلان داده

كليدواژه هاي لاتين

data mining , sentiment analysis , text mining , social media , big data

Author

Masoud Amini Motlagh

SuperVisor

Dr. Hadi Shahriar Shahhoseini

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=26215&Field=0&DTC=6