شماره ركورد
6003
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
6003
پديد آورنده
زهرا اسكندري
عنوان
شناسايي متون تقريبا يكسان با استفاده از اطلاعات ساختاري متن و معناي متن
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كامپيوتر
سال تحصيل
تير 1389
تاريخ دفاع
تير 1389
استاد راهنما
بهروز مينائي
چكيده
با گسترش لللل شبكه جهاني اينترنت و پيشرفت هاي تكنولوژي ذخيره اطلاعات حجم عظيمي از داده در اختيار كاربران قرار گرفته است . امروزه حتي رايانه هاي خانگي هم همراه با فضاي زيادي براي ذخيره و نگهداري داده ارائه مي شوند.حجم زيادي از داده هاي موجود بر روي اينترنت و رايانه هيا شخصي را متن تشكيل مي دهد. يكي از چالش هاي موجود در پردازش مجموعه داده هاي متن وجود متوني با محتوي تكراري در بين داده ها است .موضوعي كه در سال هاي اخير مورد توجه ويژه اي قرار گرفته است شناسايي متون تقريباً يكسان كاربردهاي مختلفي از جمله شناسايي تقلب، حذف صفحات تكراري از مجموعه پاسخ موتورهاي جستجو و حذف داده هاي تكراري بانك هاي اطلاعاتي دارد.