چکيده
امروزه گرايش افراد جامعه به دريافت خدمات غيرحضوري به طور چشمگيري افزايش يافته است و اكثر افراد تمايل دارند بدون نياز به حضور فيزيكي و حتي استفاده از هويت واقعي خود، خدمات مورد نيازشان را از طريق برنامههاي كاربردي يا وبسايتهاي مختلف دريافت كنند. از رايجترين روشهاي ارايه اين نوع خدمات، سامانههاي مشاوره و پرسش و پاسخ است كه موضوعات متنوعي مانند مشاورههاي پزشكي، ورزشي، آرايشي، رواندرماني و غيره را شامل ميشود. با توجه به اين كه سوالات مطرح شده در اين سامانهها عموما توسط افراد متخصص پاسخ داده ميشود، اطلاعات ارزشمندي در هريك از حوزههاي مربوطه از اين متون قابل استخراج است. يكي از حوزههاي مهم و قابل توجه، مربوط به سوالات پزشكي است. روزانه حجم عظيمي از دادههاي علمي در قالب مشاورههاي پزشكي توليد ميشود. به دليل وجود منابع دانشي غني در پاسخهاي مطرح شده در اين حوزه و همچنين حساسيت بحث سلامت، استفاده از تكنيكهاي دادهكاوي به خصوص متن كاوي به استخراج اين دانش كمك فراواني ميكند.
هدف اصلي در اين پژوهش يافتن روشهايي براي تحليل دقيق پرسشهاي مطرح شده در خلال متون رد و بدل شده بين فرد پرسشگر و مشاور جهت دستهبندي صحيح پرسشها و استخراج دادههاي موجود در پاسخ جهت ارايه آنها به پرسشهاي مشابه ساير كاربران جهت تسريع در فرآيند پاسخدهي و كاهش هزينهها است.