شماره ركورد
8705
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
8705
پديد آورنده
محمد علي يعقوب زاده فرد
عنوان
كاهش حجم نمايه در سيستمهاي بازيابي اطلاعات با استفاده از اطلاعات ادات سخن
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر گرايش نرمافزار
سال تحصيل
شهريور 1390
تاريخ دفاع
شهريور 1390
استاد راهنما
دكتر بهروز مينايي بيدگلي
چكيده
چكيده
با ظهور منابع وسيع اطلاعاتي لزوم توسعه روشهاي بازيابي اطلاعات با توجه به نيازهاي كاربران بيش از
پيش مورد توجه قرار گرفته است. روشهاي جديد مبتني بر پردازش زبان طبيعي براي بالا بردن دقت
نتايج حاصل از بازيابي در سيستمهاي بازيابي اطلاعات مورد استفاده قرار مي گيرند . بدين منظور
تكنيكهايي مانند برچسبگذاري ادات سخن براي بهبود نتايج حاصل از پرس وجو هاي متفاوت و
همچنين براي كاهش حجم نمايه و افزايش سرعت و كارايي در سيست مهاي بازيابي اطلاعات مورد
استفاده قرار گرفته است. هدف سيستمهاي بازيابي اطلاعات يافتن تمامي اسناد مربوط به پرس ش ك اربر
بدون هيچ سند نامربوطي است. كاهش حجم ذخيرهسازي نمايه با افزايش روز به روز اسناد و منابع
آنلاين بيش از پيش اهميت يافته است. با حذف كلماتي كه نقشي در نمايش محتواي اسناد ندارند مي
توان از ذخيرهسازي اطلاعات غيرمفيد جلوگيري كرد. با كاهش حجم نمايه سرعت بازيابي اطلاع ات نيز
افزايش خواهد يافت. در اكثر مواقع هدف ميزان افزونگي اطلاعاتي و يا كارايي نيست اما علاو هبر دقت
بايستي سعي شود تا اين افزونگي افزايش و كارايي نيز كاهش نيابد. لذا چگونگي استفاده از تكني كه ايي
از قبيل برچسبگذاري ادات سخن ميتواند مورد توجه قرار گيرد. در اين رساله روش هايي براي حذف
اطلاعات غيرمفيد از نمايه مطرح شده است. همچنين كاربرد و تاثير برچسب گذاري ادات سخن در بازيابي
اطلاعات در زبان فارسي بررسي شده و روشهايي براي تعيين خودكار كلمات بازدارنده پيشنهاد شده
است.
واژههاي كليدي: برچسب گذاري ادات سخن ادات سخن، پردازش زبان طبيعي، بازيابي اطلاعات، نمايه
گذاري، تعيين خودكار كلمات بازدارنده، مجموعهي موثر ادات سخن در زبان فارسي، نمايهي دو-كلمه اي،
وزندهي به كلمات پرسش