• شماره ركورد
    22551
  • پديد آورنده

    محدثه كاوياني

  • عنوان
    پيشنهاد هشتگ در توئيتر با استفاده از شبكه عصبي مبتني بر تعبيه كلمات
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    نرم‌افزار
  • سال تحصيل
    99-00
  • تاريخ دفاع
    1399/6/11
  • استاد راهنما
    دكتر حسين رحماني
  • استاد مشاور
    دكتر حسن نادري
  • دانشكده
    كامپيوتر
  • چكيده
    امروزه شبكه‌هاي اجتماعي بسيار فراگير شده‌اند كه همين امر باعث مي‌شود تحليل اطلاعات آن نتايج مفيد و متنوعي دربرداشته باشد. در بين اين شبكه‌هاي اجتماعي توئيتر يكي از مهم‌ترين و همه‌گيرترين‌ شبكه‌هاي اجتماعي است. مفهوم هشتگ براي اولين بار در توئيتر معرفي شد و امروزه به پركاربردترين روش براي برچسب‌گذاري پيام‌ها در شبكه‌هاي اجتماعي تبديل شده است. هشتگ‌ها را با قرار دادن علامت "#" در ابتداي كلمه يا عبارت مشخص مي‌كنند. در واقع هشتگ‌ها نوعي دسته‌بندي مشخص شده توسط كاربر هستند كه با استفاده از آن مي‌توان راحت‌تر در بين توئيت‌ها جست‌وجو كرد. هشتگ‌ها از قواعد زباني پيروي نمي‌كنند و همچنين بسيار كوتاه هستند به همين دليل استخراج اطلاعات از آن‌ها و تحليل آن‌ها، با روش‌هاي بازيابي اطلاعات كلاسيك، كار دشواري است اما امروزه با استفاده از ابزارهاي هوش مصنوعي و يادگيري عميق مي‌توان تحليل‌هاي گوياتر و معنادارتري در اين حوزه انجام داد. با استفاده از هشتگ، توئيت‌هاي بدون ساختار، نيمه ساختاريافته مي‌شوند و اين موضوع تحليل‌هاي مختلف در شبكه اجتماعي توئيتر را سهولت مي‌بخشد. به همين دليل پيشنهاد دادن هشتگ در اين شبكه اجتماعي، علاوه بر تشويق كاربران به استفاده از هشتگ مناسب، فوايد بسياري براي تحليل‌گران دارد. پيشنهاد هشتگ به كاربراني كه قصد استفاده از هشتگ را ندارند يا هشتگ متناسب با توئيت خود را نمي‌شناسند كمك مي‌كند تا توئيت خود را در دسته‌بندي مناسب قرار دهند. در اين پژوهش يك روش جديد براي پيشنهاد هشتگ در شبكه اجتماعي توئيتر ارائه مي‌دهيم. روش پيشنهادي يك روش مبتني بر يادگيري عميق و شبكه عصبي است. در ابتدا پس از اعمال پيش پردازش روي توئيت‌ها، توئيت‌ها و هشتگ‌ها را با استفاده از تعبيه كلمه (BERT) به بردار تبديل مي‌كنيم. سپس هشتگ‌ها را بر اساس بردارشان خوشه‌بندي مي‌كنيم. در اين روش با اعمال يك شبكه عصبي مدلي مي‌سازيم كه با استفاده از تعبيه توئيت، خوشه‌اي كه هشتگ‌هاي توئيت در آن واقع مي‌شوند را پيش‌بيني كند. در نهايت در خوشه پيش‌بيني شده بر اساس معيار شباهت كسينوسي نزديك‌ترين و شبيه‌ترين هشتگ خوشه را به بردار توئيت يافته و به كاربر پيشنهاد مي‌دهيم. در اين روش روابط معنايي همه كلمات و هشتگ‌ها با استفاده از تعبيه كلمه به خوبي درنظرگرفته مي‌شوند.
  • تاريخ ورود اطلاعات
    1399/07/14
  • عنوان به انگليسي
    Hashtag Recommendation using Neural Network based on BERT Embedding
  • تاريخ بهره برداري
    9/2/2021 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    محدثه كاوياني

  • چكيده به لاتين
    Social media like Twitter have become very popular in recent decades. Hashtags are new kind of metadata which make non-structured tweets into searchable semistructured content. There are varied previous methods which recommend hashtags for new tweets. However, to the best of our knowledge, there is no previous word that uses BERT embedding for this purpose. In this paper, we propose a new method called EmHash that uses neural network based on BERT embedding to recommend new hashtags for each tweet. Unlike other word embeddings, BERT embedding constructs different vectors for the same word in different contexts. Emhash succeeded in outperforming three methods LDA, SVM, and TTM with respect to recall measure.