شماره ركورد
6820
پديد آورنده
عرفان نجاتي
عنوان
مقايسه رويكردهاي پردازش زبان طبيعي بر روي دادههاي فارسي شبكههاي اجتماعي - مطالعه موردي شبكه اجتماعي تلگرام
مقطع تحصيلي
كارشناسي
رشته تحصيلي
صنايع
سال فارغ التحصيلي
1399
استاد راهنما
دكتر محمدرضا رسولي
دانشجوي وارد كننده اطلاعات
عرفان نجاتي
تاريخ ورود اطلاعات
1399/06/15
دانشكده
صنايع
عنوان به انگليسي
Comparison of Natural Language Processing Approaches on Persian Data of Social Networks: Telegram Messenger
چكيده
نوشتهها همواره يكي از پركاربردترين دادههاي منتشر شده در شبكههاي اجتماعي بودهاند كه اخبار، نظرات و احساسات كاربران را بين افراد منتقل ميكنند. هدف از پردازش زبان تجزيه و تحليل دادههاي متني به منظور استخراج دادهها، تبديل آن به اطلاعات و استفاده از آن براي انواع مختلف تصميمگيري است كه با توجه به نفوذ بالاي شبكههاي اجتماعي در ميان جوامع مختلف تحليل دادههاي متني اين شبكهها ميتواند در بسياري از تصميمگيريها در حوزههاي تجاري، اقتصادي، اجتماعي، بازاريابي و... راهگشا باشد.
در تحقيق پيش رو ابتدا به بررسي دانش پردازش زبان طبيعي و رويكردهاي مختلف آن پرداخته و تكنيكهاي متنكاوي كه در حوزههاي مختلف مورد استفاده قرار ميگيرند، مشخص ميشود. در ادامه يك مجموعه داده از تمام پيامهاي فارسي منتشر شده توسط كانالهاي فعال فارسي در تلگرام در مدت يك سال، جمعآوري و با رويكردها و مدلهاي يادگيري متفاوت پردازش ميگردد تا بتوان با دستهبندي محتواي متني كانالهاي تلگرامي، موضوع فعاليت آن را پيشبيني كرد. در نهايت رويكردها و مدلهاي يادگيري بر اساس حساسيت، دقت، امتياز-اِف و زمان اجرا مقايسه شده و بهترين مسير براي پيادهسازي پردازش زبان طبيعي بر روي دادههاي فارسي شبكههاي اجتماعي معرفي ميگردند.