-
شماره ركورد
8117
-
عنوان
بررسي انواع روشهاي تشخيص موضوع از دادههاي متني
-
سال تحصيل
1399
-
استاد راهنما
دكتر حسين رحماني
-
چکيده
امروزه، با توسعه سريع فناوري اطلاعات و استفاده گسترده از آن، اينترنت به عنوان يك حامل اطلاعات، به تدريج جايگزين رسانههاي سنتي مانند روزنامه و تلويزيون شدهاست. دادههاي توليدشده در اينترنت توسط افراد بهصورت نمايي در حال افزايش است. اكنون، اينترنت با داشتن بيش از 5/4 ميليارد كاربر فعال و روزانه 2،500،000 ترابايت ديتاي توليدشده، كه حجم قابل توجهي از آن را متنها تشكيل ميدهند، تاثير بسزايي در زندگي ما دارد. در مواجهه با اين حجم از دادهها، پردازش و چگونگي استخراج اطلاعات به يك نگراني عمومي تبديل شدهاست. در دنياي امروز كه بررسي اين حجم از دادههاي متني فراتر از توان ماست؛ تشخيص موضوع متون ميتواند راهي براي درك و مديريت كلاندادههاي انباشتهشده در اختيار ما قرار دهد. تشخيص موضوع، فرايند گشتوگذار كاربر را نيز در اين فضاي پيچيده، راحتتر ميكند. بنابراين يكي از چالشهاي موجود در فضاي كلانداده طبقهبندي موضوعي دادههاي متني است. فرايند تشخيص موضوع، بر كشف موضوعاتي كه مجموعهاي از اسناد به آنها پرداختهاند متمركز شده است، بهطوريكه از موضوعات تعريفشده انتظار ميرود كه از نظر موضوعي مشابه، منسجم و خودمحور باشند.
فرايند تشخيص موضوع بهصورت دستي، امري زمانبر و خسته كننده است و با توجه به افزايش حجم و تنوع اسناد بدون برچسب در اينترنت، به امري غيرممكن براي انسان تبديل شدهاست. بنابراين، فرايند تشخيص موضوع از متن به صورت خودكار و كارآمد به امري مهم و حياتي در دنياي اينترنت تبديل شده است. علاوه بر آن، تشخيص موضوع به عنوان يكي از شاخههاي پردازش زبانهاي طبيعي و متنكاوي، پايهي بسياري از تحليلهاي متني مانند پيشبيني روند موضوع، استخراج افكار، خلاصهسازي و طبقهبندي متون است. از روشهاي موجود تشخيص موضوع ميتوان در شخصيسازي و بهينهسازي موتورهاي جستجو و سيستمهاي توصيهگر متني، سيستمهاي پرسش و پاسخ و شبكههاي اجتماعي مانند توييتر و وبلاگها استفاده كرد. حتي از استخراج موضوع در شبكههاي اجتماعي بهعنوان هشدار دهنده فاجعههاي طبيعي نيز استفاده ميشود. بنابراين ما در اين سمينار به بررسي انواع روشهاي تشخيص موضوع از دادههاي متني ميپردازيم.
-
نام دانشجو
محمد نظري
-
تاريخ ارائه
12/30/2020 12:00:00 AM
-
متن كامل
70273
-
پديد آورنده
محمد نظري
-
تاريخ ورود اطلاعات
1399/10/27
-
عنوان به انگليسي
survey of topic extraction approaches from textual data
-
كليدواژه هاي فارسي
متن كاوي , پردازش زبانهاي طبيعي , تشخيص موضوع , مدلسازي موضوعي
-
كليدواژه هاي لاتين
Text mining , natural language processing , topic detection , topic modeling , topic extraction
-
لينک به اين مدرک :