• شماره ركورد
    8117
  • عنوان
    بررسي انواع روش‌هاي تشخيص موضوع از داده‌هاي متني
  • سال تحصيل
    1399
  • استاد راهنما
    دكتر حسين رحماني
  • چکيده
    امروزه، با توسعه سريع فناوري اطلاعات و استفاده گسترده از آن، اينترنت به عنوان يك حامل اطلاعات، به تدريج جايگزين رسانه‌هاي سنتي مانند روزنامه و تلويزيون شده‌است. داده‌هاي توليد‌شده در اينترنت توسط افراد به‌صورت نمايي در حال افزايش است. اكنون، اينترنت با داشتن بيش از 5/4 ميليارد كاربر فعال و روزانه 2،500،000 ترابايت ديتاي توليدشده، كه حجم قابل توجهي از آن را متن‌ها تشكيل مي‌دهند، تاثير بسزايي در زندگي ما دارد. در مواجهه با اين حجم از داده‌ها، پردازش و چگونگي استخراج اطلاعات به يك نگراني عمومي تبديل شده‌است. در دنياي امروز كه بررسي اين حجم از داده‌هاي متني فراتر از توان ماست؛ تشخيص موضوع متون مي‌تواند راهي براي درك و مديريت كلان‌داده‌هاي انباشته‌شده در اختيار ما قرار دهد. تشخيص موضوع، فرايند گشت‌وگذار كاربر را نيز در اين فضاي پيچيده، راحت‌تر مي‌كند. بنابراين يكي از چالش‌هاي موجود در فضاي كلان‌داده طبقه‌بندي موضوعي داده‌هاي متني است. فرايند تشخيص موضوع، بر كشف موضوعاتي كه مجموعه‌اي از اسناد به آن‌ها پرداخته‌اند متمركز شده است، به‌طوري‌كه از موضوعات تعريف‌شده انتظار مي‌رود كه از نظر موضوعي مشابه، منسجم و خودمحور باشند. فرايند تشخيص موضوع به‌صورت دستي، امري زمان‌بر و خسته كننده است و با توجه به افزايش حجم و تنوع اسناد بدون برچسب در اينترنت، به امري غيرممكن براي انسان تبديل شده‌است. بنابراين، فرايند تشخيص موضوع از متن به صورت خودكار و كارآمد به امري مهم و حياتي در دنياي اينترنت تبديل شده است. علاوه بر آن، تشخيص موضوع به عنوان يكي از شاخه‌هاي پردازش زبان‌هاي طبيعي و متن‌كاوي، پايه‌ي بسياري از تحليل‌هاي متني مانند پيش‌بيني روند موضوع، استخراج افكار، خلاصه‌سازي و طبقه‌بندي متون است. از روش‌هاي موجود تشخيص موضوع مي‌توان در شخصي‌سازي و بهينه‌سازي موتورهاي جستجو و سيستم‌هاي توصيه‌گر متني، سيستم‌هاي پرسش و پاسخ و شبكه‌هاي اجتماعي مانند توييتر و وبلاگ‌ها استفاده كرد. حتي از استخراج موضوع در شبكه‌هاي اجتماعي به‌عنوان هشدار دهنده فاجعه‌هاي طبيعي نيز استفاده مي‌شود. بنابراين ما در اين سمينار به بررسي انواع روش‌هاي تشخيص موضوع از داده‌هاي متني مي‌پردازيم.
  • نام دانشجو

    محمد نظري

  • تاريخ ارائه
    12/30/2020 12:00:00 AM
  • متن كامل
    70273
  • پديد آورنده

    محمد نظري

  • تاريخ ورود اطلاعات
    1399/10/27
  • عنوان به انگليسي
    survey of topic extraction approaches from textual data
  • كليدواژه هاي فارسي
    متن كاوي , پردازش زبان‌هاي طبيعي , تشخيص موضوع , مدلسازي موضوعي
  • كليدواژه هاي لاتين
    Text mining , natural language processing , topic detection , topic modeling , topic extraction