-
شماره ركورد
7294
-
پديد آورنده
اميرحسين گرزين
-
عنوان
تحليل توييتهاي فارسي شبكه اجتماعي توييتر با استفاده از الگوريتمهاي يادگيري ماشين در پايتون
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي صنايع
-
سال فارغ التحصيلي
1400
-
استاد راهنما
مهدي غضنفري
-
دانشجوي وارد كننده اطلاعات
اميرحسين گرزين
-
تاريخ ورود اطلاعات
1400/06/09
-
دانشكده
مهندسي صنايع
-
عنوان به انگليسي
Analysis of Persian tweets in Twitter social network using machine learning algorithms in Python
-
چكيده
واكسيناسيون كرونا از موضوعات روز كشورهاي مختلف در جهت جلوگيري از شيوع اين بيماري است. سياستهاي مختلفي در زمينه تهيه، توزيع و توليد واكسن توسط كشورهاي مختلف اعمال شده است. در اين راستا، ايران نيز سياستهايي را اعمال كردهاست.
در اين پژوهش به ارائه تحليل عواطف و مدلسازي عناوين براي توييتهاي فارسي منتشر شده در رابطه با سياستهاي واكسيناسيون در ايران، در شبكه اجتماعي توييتر ميپردازيم. 556714 توييت فارسيِ يكتا از تاريخ 15 آذر 1399 تا 15 فروردين 1400 جمعآوري شد و پس از پيشپردازش و پاكسازي دادگان در قالب دو مرحله بروي توييتهاي اصلي، مدلسازي انجام شد. در مرحله اول؛ توييتهاي مرتبط با موضوع با استفاده از مدل دستهبندِ آموزشديده دستهبندي شد و بروي توييتهاي مرتبط خوشهبندي (مدلسازي عناوين) صورت گرفت. در مرحله دوم؛ بروي توييتهاي مرتبط تحليل عواطف صورت گرفت و براساس موافقت، مخالفت و يا خنثي بودن در رابطه با سياستهاي واكسيناسيون در ايران دستهبندي شدند.
از 308698 توييت اصلي؛ 239746 مرتبط با موضوع شناسايي شدند و در قالب 10 عنوان، خوشهبندي (مدلسازي عناوين) شدند. از اين تعداد، 162315 توييت با نظر منفي، 54382 توييت با نظر مثبت و 13049 توييت با نظر خنثي شناسايي شدند. در عمليات دستهبندي و تحليل عواطف از مدلهاي شبكه عصبي عميق و در عمليات مدلسازي عناوين از روشهاي فاكتورگيري نامفني ماتريس (NMF) و تخصيص پنهان دريكله (LDA) به عنوان روشهاي اصلي استفاده شد.
-
كليدواژه ها
تحليل توييتر , سياستهاي واكسيناسيون , تحليل عواطف , مدلسازي عناوين , شبكه عصبي عميق
-
لينک به اين مدرک :