-
شماره ركورد
26215
-
پديد آورنده
مسعود اميني مطلق
-
عنوان
تحليل احساسات در داده هاي شبكه هاي اجتماعي از طريق روش هاي داده كاوي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق
-
تاريخ دفاع
1400/9/8
-
استاد راهنما
دكتر هادي شهريار شاه حسيني
-
دانشكده
مهندسي برق
-
چكيده
شبكههاي اجتماعي محيطي هستند كه كاربران احساس و عقايد روزمره خود را در آنها به اشتراك ميگذارند. متن همچنان به عنوان يكي از پركاربردترين روشها براي ارتباط در شبكههاي اجتماعي به حساب ميآيد و از آن براي بيان احساسات و عقايد استفاده ميشود. تحليل احساسات روشي براي تشخيص و شناسايي احساسات عقايد و نظرات از متن دادههاي نوشته شده در شبكههاي اجتماعي ميباشد. دادهكاوي به عنوان يكي از روشهاي كاربردي براي استخراج و تحليل اين دادهها به حساب ميآيد. در اين پروژه ما از چهار روش دستهبندي در دادهكاوي كه بيشترين كاربرد را در اين زمينه دارند، استفاده كرديم. اين چهار روش دوبار روي مجموعه داده استخراج شده از شبكههاي اجتماعي اعمال شد؛ ابتدا روي دادهها با دو ويژگي مثبت و منفي و سپس روي دادهها با سه ويژگي مثبت، منفي و خنثي. افزون بر اين روشها، ما از دو روش تجميعي نيز براي مدلسازي و طبقهبندي بهره برديم. همچنين مجموعه داده را به دو دسته آموزشي و آزمايشي با نسبت هاي مختلف تقسيم كرديم. نتايج بدست آمده نشان ميدهد با روش استفاده شده در اين پروژه، طبقهبند ماشين بردار پشتيبان (SVM) در ميان طبقهبندهاي ديگر نتايج بهتري را ارائه ميدهد. روش SVM در دستهبندي دوتايي 3/53 % و در دستهبندي سهتايي 7/41 % دقت بيشتري نسبت به روشهاي ديگر ارائه داده است. همچنين روش ارائه شده در اين پاياننامه نسبت به منابع ديگر در معيار دقت، 3/52 % در دستهبندي دوتايي و 5/91 % در دستهبندي سهتايي بهبود داشته است؛ اين بهبود در شرايطي است كه در اين پروژه تقسيم دادههاي آموزشي و دادههاي آزماشي از طريق روش K-Fold Cross Validation انجام شده است. همچنين نتايج نشان ميدهد استفاده از 50 % دادهها به عنوان داده آموزشي، نتايج تقريبا يكساني با نسبت 70 % دارد؛ در حاليكه استفاده از روش K-Fold Cross Validation با K=10 ميتواند نتايج بهتري را ارائه دهد.
-
تاريخ ورود اطلاعات
1400/12/18
-
عنوان به انگليسي
Sentiment Analysis of Social Media Data through Data Mining Techniques
-
تاريخ بهره برداري
11/29/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مسعود اميني مطلق
-
چكيده به لاتين
Social networks represent an established environment in which users share their daily emotions and opinions. Text is still one of the most common ways of communication in a social network, since users utilize it to express their opinions and emotions on various and diverse topics. Sentiment Analysis (SA) is an approach to identify sentiments of the opinions from the text of social media data. Data mining is considered as one of the practical methods for extracting and analyzing this data. In this article we apply four widely used data mining classifiers on one dataset twice. First, on binomial (positive and negative) data and second, on polynomial (positive, negative and neutral) data to analyze the sentiment of texts. Furthermore, we utilize two ensemble methods in order to classify the texts. We also devided the dataset to training set and testing set with different percentages. Our results shows that Support Vector Machine (SVM) demonstrates a better accuracy compared to other machine learning algorithms with improvements of 3.53% on binomial and 7.41% on polynomial dataset. Results also demonstrate that accuracy has improved 3.52% on binomial and 5.91% on polynomial classification compared to other references. This improvement is in the context that we used the training and testing data were divided through the K-Fold Cross Validation method. Results also demonstrate that using 50% of the dataset as training data has almost the same results as 70%; while using 10-Fold Cross Validation can reach better results.
-
كليدواژه هاي فارسي
داده كاوي , تحليل احساسات , متن كاوي , شبكه اجتماعي , كلان داده
-
كليدواژه هاي لاتين
data mining , sentiment analysis , text mining , social media , big data
-
Author
Masoud Amini Motlagh
-
SuperVisor
Dr. Hadi Shahriar Shahhoseini
-
لينک به اين مدرک :