• شماره ركورد
    6820
  • پديد آورنده

    عرفان نجاتي

  • عنوان
    مقايسه رويكردهاي پردازش زبان طبيعي بر روي داده‌هاي فارسي شبكه‌هاي اجتماعي - مطالعه موردي شبكه اجتماعي تلگرام
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    صنايع
  • سال فارغ التحصيلي
    1399
  • استاد راهنما
    دكتر محمدرضا رسولي
  • دانشجوي وارد كننده اطلاعات

    عرفان نجاتي

  • تاريخ ورود اطلاعات
    1399/06/15
  • دانشكده
    صنايع
  • عنوان به انگليسي
    Comparison of Natural Language Processing Approaches on Persian Data of Social Networks: Telegram Messenger
  • چكيده
    نوشته‌ها همواره يكي از پركاربردترين داده‌هاي منتشر شده در شبكه‌هاي اجتماعي بوده‌اند كه اخبار، نظرات و احساسات كاربران را بين افراد منتقل مي‌كنند. هدف از پردازش زبان تجزيه و تحليل داده‌هاي متني به منظور استخراج داده‌ها، تبديل آن به اطلاعات و استفاده از آن براي انواع مختلف تصميم‌گيري است كه با توجه به نفوذ بالاي شبكه‌هاي اجتماعي در ميان جوامع مختلف تحليل داده‌هاي متني اين شبكه‌ها ميتواند در بسياري از تصميم‌گيري‌ها در حوزه‌هاي تجاري، اقتصادي، اجتماعي، بازاريابي و... راهگشا باشد. در تحقيق پيش رو ابتدا به بررسي دانش پردازش زبان طبيعي و رويكردهاي مختلف آن پرداخته و تكنيك‌هاي متن‌كاوي كه در حوزه‌هاي مختلف مورد استفاده قرار مي‌گيرند، مشخص مي‌شود. در ادامه يك مجموعه داده از تمام پيام‌هاي فارسي منتشر شده توسط كانال‌هاي فعال فارسي در تلگرام در مدت يك سال، جمع‌آوري و با رويكردها و مدل‌هاي يادگيري متفاوت پردازش مي‌گردد تا بتوان با دسته‌بندي محتواي متني كانال‌هاي تلگرامي، موضوع فعاليت آن را پيش‌بيني كرد. در نهايت رويكرد‌ها و مدل‌هاي يادگيري بر اساس حساسيت، دقت، امتياز-اِف و زمان اجرا مقايسه شده و بهترين مسير براي پياده‌سازي پردازش زبان طبيعي بر روي داده‌هاي فارسي شبكه‌هاي اجتماعي معرفي مي‌گردند.