-
شماره ركورد
8705
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
8705
-
پديد آورنده
محمد علي يعقوب زاده فرد
-
عنوان
كاهش حجم نمايه در سيستمهاي بازيابي اطلاعات با استفاده از اطلاعات ادات سخن
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر گرايش نرمافزار
-
سال تحصيل
شهريور 1390
-
تاريخ دفاع
شهريور 1390
-
استاد راهنما
دكتر بهروز مينايي بيدگلي
-
چكيده
چكيده
با ظهور منابع وسيع اطلاعاتي لزوم توسعه روشهاي بازيابي اطلاعات با توجه به نيازهاي كاربران بيش از
پيش مورد توجه قرار گرفته است. روشهاي جديد مبتني بر پردازش زبان طبيعي براي بالا بردن دقت
نتايج حاصل از بازيابي در سيستمهاي بازيابي اطلاعات مورد استفاده قرار مي گيرند . بدين منظور
تكنيكهايي مانند برچسبگذاري ادات سخن براي بهبود نتايج حاصل از پرس وجو هاي متفاوت و
همچنين براي كاهش حجم نمايه و افزايش سرعت و كارايي در سيست مهاي بازيابي اطلاعات مورد
استفاده قرار گرفته است. هدف سيستمهاي بازيابي اطلاعات يافتن تمامي اسناد مربوط به پرس ش ك اربر
بدون هيچ سند نامربوطي است. كاهش حجم ذخيرهسازي نمايه با افزايش روز به روز اسناد و منابع
آنلاين بيش از پيش اهميت يافته است. با حذف كلماتي كه نقشي در نمايش محتواي اسناد ندارند مي
توان از ذخيرهسازي اطلاعات غيرمفيد جلوگيري كرد. با كاهش حجم نمايه سرعت بازيابي اطلاع ات نيز
افزايش خواهد يافت. در اكثر مواقع هدف ميزان افزونگي اطلاعاتي و يا كارايي نيست اما علاو هبر دقت
بايستي سعي شود تا اين افزونگي افزايش و كارايي نيز كاهش نيابد. لذا چگونگي استفاده از تكني كه ايي
از قبيل برچسبگذاري ادات سخن ميتواند مورد توجه قرار گيرد. در اين رساله روش هايي براي حذف
اطلاعات غيرمفيد از نمايه مطرح شده است. همچنين كاربرد و تاثير برچسب گذاري ادات سخن در بازيابي
اطلاعات در زبان فارسي بررسي شده و روشهايي براي تعيين خودكار كلمات بازدارنده پيشنهاد شده
است.
واژههاي كليدي: برچسب گذاري ادات سخن ادات سخن، پردازش زبان طبيعي، بازيابي اطلاعات، نمايه
گذاري، تعيين خودكار كلمات بازدارنده، مجموعهي موثر ادات سخن در زبان فارسي، نمايهي دو-كلمه اي،
وزندهي به كلمات پرسش
-
لينک به اين مدرک :