-
شماره ركورد
10373
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
10373
-
پديد آورنده
سعيد كريمي
-
عنوان
بهبود بازيابي اطلاعات متون فارسي با استفاده از برچسبگذاري ادات سخن و وزندهي كلمات
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر - نرمافزار
-
سال تحصيل
فروردين ماه 1391
-
تاريخ دفاع
فروردين ماه 1391
-
استاد راهنما
دكتر محمد عبداللهي ازگمي - دكتر بهروز مينايي بيدگلي
-
چكيده
توسعه سيستمهاي رايانهاي و گسترش استفاده از فناوري اطلاعات در زندگي روزمره باعث شده تا اطلاعات از درجه اهميت بالايي برخوردار شوند؛ چنانكه عصر حاضر را «عصر اطلاعات» ناميدهاند. هرچه حجم اين اطلاعات افزايش مييابد كنترل و مديريت آن مشكلتر ميشود، لذا توليد و وجود اطلاعات به تنهايي كافي نيست بلكه بايد ابزارهايي براي استفاده از اين اطلاعات فراهم شود. در نتيجه روشهاي بازيابي اطلاعات در قالب پاسخدهي به نياز اطلاعاتي كاربران اهميت ويژهاي پيدا ميكند. به طور كلي در سيستمهاي بازيابي اطلاعات، مهمترين عامل كه نقش كلمات را از نظر ميزان تاثير آنها به عنوان كلمات كليدي متن مشخص ميكند، وزن كلمه است. در مرحله وزندهي، با استفاده از تكنيكهاي مختلف وزندهي، به هر كلمه يا عبارت استخراج شده وزني نسبت داده ميشود. اين وزن بيانگر ميزان تاثير كلمه در موضوع اصلي متن در مقايسه با ساير كلمات به كار رفته در متن است. از يك سو ميتوان ادعا نمود كه هر چه ميزان دقت تعيين وزن كلمات بالاتر باشد و وزنهاي تخصيصي، واقعيتر باشند، دقت بازيابي نيز افزايش خواهد يافت لذا ارائه يك روش وزندهي مناسب ميتواند دقت بازيابي متون را بهبود بخشد. از سوي ديگر با بهرهگيري از اطلاعات ادات سخن، ميتوان ميزان دقت وزندهي و در نتيجه دقت بازيابي را در متون فارسي بهبود بخشيد.
در اين پاياننامه پس از بررسي روشهاي وزندهي موجود، يك روش وزندهي در حوزه مدلهاي احتمالي معرفي ميشود، سپس اين روش بسط داده شده طوريكه بتوان ويژگيهايي خاص با ضرايبي مشخص را در آن لحاظ نمود و در انتها با استفاده از اين تابع وزندهي و به كارگيري اطلاعات ادات سخن، به عنوان يكي از ويژگيهاي زبان فارسي، سعي خواهد شد تا كارايي سيستمهاي بازيابي اطلاعات در متون فارسي بهبود يابد.
نتايج بيانگر تاثير مثبت استفاده از اطلاعات ادات سخن در تعيين وزن كلمات و بهبود معيارهاي بازيابي در متون فارسي است.
واژههاي كليدي:
بازيابي اطلاعات، وزندهي كلمات، زبان فارسي، رتبهبندي اسناد، مدلهاي احتمالي
-
لينک به اين مدرک :