• شماره ركورد
    7294
  • پديد آورنده

    اميرحسين گرزين

  • عنوان
    تحليل توييت‌هاي فارسي شبكه اجتماعي توييتر با استفاده از الگوريتم‌هاي يادگيري ماشين در پايتون
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي صنايع
  • سال فارغ التحصيلي
    1400
  • استاد راهنما
    مهدي غضنفري
  • دانشجوي وارد كننده اطلاعات

    اميرحسين گرزين

  • تاريخ ورود اطلاعات
    1400/06/09
  • دانشكده
    مهندسي صنايع
  • عنوان به انگليسي
    Analysis of Persian tweets in Twitter social network using machine learning algorithms in Python
  • چكيده
    واكسيناسيون كرونا از موضوعات روز كشور‌هاي مختلف در جهت جلوگيري از شيوع اين بيماري است. سياست‌هاي مختلفي در زمينه تهيه، توزيع و توليد واكسن توسط كشور‌هاي مختلف اعمال شده است. در اين راستا، ايران نيز سياست‌هايي را اعمال كرده‌است. در اين پژوهش به ارائه تحليل عواطف و مدلسازي عناوين براي توييت‌هاي فارسي منتشر شده در رابطه با سياست‌هاي واكسيناسيون در ايران، در شبكه اجتماعي توييتر مي‌پردازيم. 556714 توييت‌ فارسيِ يكتا از تاريخ 15 آذر 1399 تا 15 فروردين 1400 جمع‌آوري شد و پس از پيش‌پردازش و پاكسازي دادگان در قالب دو مرحله بروي توييت‌هاي اصلي، مدلسازي انجام شد. در مرحله اول؛ توييت‌هاي مرتبط با موضوع با استفاده از مدل دسته‌بندِ آموزش‌ديده دسته‌بندي شد و بروي توييت‌هاي مرتبط خوشه‌بندي (مدل‌سازي عناوين) صورت گرفت. در مرحله دوم؛ بروي توييت‌هاي مرتبط تحليل عواطف صورت گرفت و براساس موافقت، مخالفت و يا خنثي بودن در رابطه با سياست‌هاي واكسيناسيون در ايران دسته‌بندي شدند. از 308698 توييت اصلي؛ 239746 مرتبط با موضوع شناسايي شدند و در قالب 10 عنوان، خوشه‌بندي (مدل‌سازي عناوين) شدند. از اين تعداد، 162315 توييت با نظر منفي، 54382 توييت با نظر مثبت و 13049 توييت با نظر خنثي شناسايي شدند. در عمليات دسته‌بندي و تحليل عواطف از مدل‌هاي شبكه عصبي عميق و در عمليات مدل‌سازي عناوين از روش‌هاي فاكتورگيري نامفني ماتريس (NMF) و تخصيص پنهان دريكله (LDA) به عنوان روش‌هاي اصلي استفاده شد.
  • كليدواژه ها
    تحليل توييتر , سياست‌هاي واكسيناسيون , تحليل عواطف , مدلسازي عناوين , شبكه عصبي عميق