شماره ركورد
14404
عنوان
الگوريتم چند معياري رتبه بندي صفحات وب و موتور جستجوي پياده سازي شده بر اساس آن
سال تحصيل
1398
استاد راهنما
جناب آقاي دكتر خنجري
استاد مشاور
جناب آقاي دكتر خنجري
چکيده
چكيده
موتور جستجو وب يا engine search web يك
نوع وب سايت است كه اطالعات موجود در سراسر
وب را با استفاده از ماژول هاي نرم افزاري خود
جمعآوري و دسته بندي و رتبه بندي مي كند.
موتورهاي جستجو حداقل 3 عمل پايه اي خزيدن،
ايندكسكردن و رتبه بندي را انجام مي دهند .
1_ خزيدن در وب (Crawling(: خزش يا خزيدن
يك پروسه است. اين فرآيند در هر موتور جستجو
به صورت جداگانه انجام مي شود. يك خزشگر با
استفاده از لينك صفحات، بين تمامي صفحات
حركت مي كند و اطالعات صفحات را جمع آوري
مي كند.
در طي عمليات خزش، ربات ها وارد صفحات
وبسايت مي شوند و از صفحه اي به صفحه ديگر
مي روند. ربات ها با خزيدن و سپس دنبال كردن
آدرس هاي موجود در صفحات وب، صفحات جديد
را پيدا ميكنند و در بانك اطالعاتي موتور جستجوي
مرتبط ثبت مي كنند .
2_ نمايه كردن (Indexing(: ايندكس )index )
نحوه نگه داري داده هاي بانك اطالعاتي يك موتور
جستجو شامل اطالعات صفحات وب، مي باشد . اين
بانك اطالعاتي شامل اطالعات صفحات و منابعي
است كه توسط موتورهاي جستجو خزش شده اند .
وقتي خزشگر ها وارد صفحه اي مي شوند در
جستجوي اين هستند كه اين صفحه براي كدام
كلمه كليدي و يا كدام مفهوم بهينه شده
است. سپس چنانچه صفحه شرايط ايندكس شدن
را داشته باشد، صفحه را به اصطالح ايندكس
مي كنند يعني در بانك اطالعاتي موتور جستجو و به
شكل خاصي از فهرست بندي، ذخيره مي كنند .
3_ رتبه بندي صفحات (Ranking(: رتبه بندي
يك فرآيند است. اين فرآيند توسط سيستم رتبه
بندي موتور جستجو انجام ميشود. اين سيستم يا
سامانه، متشكل از تمام الگوريتمهاي رنكينگ موتور
جستجو است. اين سيستم بايد در نهايت مرتبط
ترين، تخصصي ترين و معتبر ترين نتايج را به كاربر
نشان دهد .
در اين مقاله يك الگوريتم چند معياري براي رتبه
بند ي صفحات وب ابداع و ارائه شده است كه بر
اساس چندين معيار و شاخص اقدام به رتبه بندي
صفحات وب مي نمايد و همچنين براي نشان دادن
كارايي الگوريتم، يك موتور جستجو ي وب بر
اساس آن نوشته و پياده سازي و شرح داده شده
است.
نام دانشجو
صائب گل محمدي
تاريخ ارائه
10/23/2023 12:00:00 AM
متن كامل
85561
پديد آورنده
صائب گل محمدي
تاريخ ورود اطلاعات
1403/10/25
عنوان به انگليسي
Multi-criteria algorithm for ranking web pages and the search engine implemented based on it