شماره ركورد
7294
پديد آورنده
اميرحسين گرزين
عنوان
تحليل توييتهاي فارسي شبكه اجتماعي توييتر با استفاده از الگوريتمهاي يادگيري ماشين در پايتون
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي صنايع
سال فارغ التحصيلي
1400
استاد راهنما
مهدي غضنفري
دانشجوي وارد كننده اطلاعات
اميرحسين گرزين
تاريخ ورود اطلاعات
1400/06/09
دانشكده
مهندسي صنايع
عنوان به انگليسي
Analysis of Persian tweets in Twitter social network using machine learning algorithms in Python
چكيده
واكسيناسيون كرونا از موضوعات روز كشورهاي مختلف در جهت جلوگيري از شيوع اين بيماري است. سياستهاي مختلفي در زمينه تهيه، توزيع و توليد واكسن توسط كشورهاي مختلف اعمال شده است. در اين راستا، ايران نيز سياستهايي را اعمال كردهاست.
در اين پژوهش به ارائه تحليل عواطف و مدلسازي عناوين براي توييتهاي فارسي منتشر شده در رابطه با سياستهاي واكسيناسيون در ايران، در شبكه اجتماعي توييتر ميپردازيم. 556714 توييت فارسيِ يكتا از تاريخ 15 آذر 1399 تا 15 فروردين 1400 جمعآوري شد و پس از پيشپردازش و پاكسازي دادگان در قالب دو مرحله بروي توييتهاي اصلي، مدلسازي انجام شد. در مرحله اول؛ توييتهاي مرتبط با موضوع با استفاده از مدل دستهبندِ آموزشديده دستهبندي شد و بروي توييتهاي مرتبط خوشهبندي (مدلسازي عناوين) صورت گرفت. در مرحله دوم؛ بروي توييتهاي مرتبط تحليل عواطف صورت گرفت و براساس موافقت، مخالفت و يا خنثي بودن در رابطه با سياستهاي واكسيناسيون در ايران دستهبندي شدند.
از 308698 توييت اصلي؛ 239746 مرتبط با موضوع شناسايي شدند و در قالب 10 عنوان، خوشهبندي (مدلسازي عناوين) شدند. از اين تعداد، 162315 توييت با نظر منفي، 54382 توييت با نظر مثبت و 13049 توييت با نظر خنثي شناسايي شدند. در عمليات دستهبندي و تحليل عواطف از مدلهاي شبكه عصبي عميق و در عمليات مدلسازي عناوين از روشهاي فاكتورگيري نامفني ماتريس (NMF) و تخصيص پنهان دريكله (LDA) به عنوان روشهاي اصلي استفاده شد.
كليدواژه ها
تحليل توييتر , سياستهاي واكسيناسيون , تحليل عواطف , مدلسازي عناوين , شبكه عصبي عميق