-
شماره ركورد
9279
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
9279
-
پديد آورنده
خليل عليجاني ممقاني
-
عنوان
ارائه الگوريتمي براي مرحله ادغام نتايج در بازيابي اطلاعات توزيع شده
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر - نرم افزار
-
سال تحصيل
آبان 1390
-
تاريخ دفاع
آبان 1390
-
استاد راهنما
حق جو
-
چكيده
چكيده
بازيابي اطلاعات به تكنيكهايي جهت يافتپ اطلاعات ) معمولا اسرناد ( اطرلاق مري شرود بره طرور يكره
اطلاعات مرتبط با نياز كاربر در رتبههرا ي برالاتر ي قررار گ يرنرد. افرزا يش روزافرزون اطلاعرات ، سيسرتم هرا ي
متمركز را براي بازيابي كاراي اطلاعات ناتوان كرده است، از اينرو براي غلبره برر ا ير پ نقرص از سيسرتم هرا ي
بازيابي اطلاعات توزيع شده استفاده ميشود. فرثيند بازيابي اطلاعات توزيع شده بره صرورت واسرط ي عمرل
ميكند تا توانايي جستجوي همزمان اسناد را از چنديپ سيستم بازير ابي اطلاعرات مسرتقل ) مجموعره هرا ي راه
دور ( براي كاربر فراهم كند. ايپ فرثيند از سه مرحلهي اصلي تشكيل شده است : نمايش مجموع ههرا بره
صورت برون خطي انجام ميشود، با ورود هر پرس و جو انتخاب مجموعهها بره صرورت بررخط صرورت
گرفته و سپس در مرحلهي ادغام نتايج، جوابهاي برگردانده از ايپ مجموعهها ادغام شده و به كاربر نشان
داده ميشود. به دليل وجود خاصيت توزيع شدگي، ايپ فرثيند با چرالش هرا يي در هرر كردام از ا ير پ مراحرل
روبروست كه باعث كاهش رقم دقت در هركدام از ايپ مراحل و در نتيجه كاهش دقرت كلر ي بازير ابي مر ي -شود.
مرحلهي اول بازيابي اطلاعات توزيع شده، ايجاد اطلاعاتي در مورد مجموعهها ميباشرد. اير پ اطلاعرات
پس از جمعثوري از مجموعهها ) كه به ثن نمونهگيري گفته ميشود ( در يك شاخص نگهداري شرده و در
دو مرحلهي بعد با استفاده از اطلاعات ايپ شراخص ، مجموعره هرا انتخراب و نترا يج برگردانرده شرده از ث نهرا
تركيب ميشوند. بديهيست كه كيفيت اطلاعات شاخص به اطلاعات جمعثوري شده از مجموعهها بسرتگ ي
دارد كه علاوه بر سربار حافظه، سربار زماني در دو مرحلهي انتخاب مجموعهها و ادغام نتايج ايجاد مي كند.
در ايپ پاياننامه روشي براي ادغام نتايج ارائه ميشود كه نيازي به استفاده از شراخص نمونره گير ري شرده
ندارد. از ثنجا كه ادغام نتايج به انتخاب مجموعره هرا ن ير ز بسرتگ ي دارد روشر ي هرم بررا ي مرحلره ي انتخراب
مجموعهها ارائه ميشود. در روش ارائه شده براي مرحلهي ادغام نتايج به جاي امتياز سندها، دليل امتيرازدهي
به سندها )مانند موقعيت كلمهها در سند( از مجموعهها درخواست ميشود. با استفاده از ايپ دليل، امتيازي بره
هر سند داده ميشود و به ايپ ترتيب نتايج برگردانده شده از مجموعهها با استفاده از ايپ امتياز ادغام ميشوند.
به منظور ارزيابي روش ارائه شده براي مرحله ي ادغام نتايج، محيط هاي ثزمرايش را برا اسرتفاده از اسرناد پيكرهي همشهري ايجاد كرده و ثزمايشها را روي سيستم بازيابي اطلاعات توزيع شدهاي كه چنديپ سيستم
بازيابي اطلاعات مستقل ) با مدلهاي بازيابي متفاوت ( را مديريت مي كند، اجرا مري كنريم. نترا يج ارزير ابيهرا
نشان ميدهد كه روش ارائه شده براي مرحلهي ادغام نتايج در محيطهاي ثزمايش مختل ، دقرت باز ير ابي را
افزايش ميدهد.
واژه هاي كليدي: بازيابي اطلاعات توزيع شرده، نمرا يش مجموعره، انتخراب مجموعره، ادغرام نترايج ،
مدل هاي بازيابي اطلاعات، موقعيت واژهها، دقت بازيابي
-
لينک به اين مدرک :