-
شماره ركورد
18605
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
۱۸۶۰۵
-
پديد آورنده
مريم رهنما
-
عنوان
طراحي و پيادهسازي الگوريتمي با معماري چندلايه جهت تشخيص سرقت علمي در متون فارسي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
نرم افزار
-
تاريخ دفاع
آذرماه ۱۳۹۶
-
استاد راهنما
دكتر عين اله خنجري ميانه
-
دانشكده
كامپيوتر
-
چكيده
به اقتباس از آثار علمي ديگران بدون ارجاع صحيح به اسناد اصلي، سرقت علمي اطلاق مي گردد. اگرچه اين عمل داراي قدمتي طولاني است اما پيشرفت رسانه ها و دسترسي آسان به وسايل ارتباطي در طي سالهاي اخير باعث رشد سريع سرقت علمي گشته است. سرقت علمي در حوزه متن رايج تر از ساير فرمتهاي محتوايي است و مقاله ها و پايان نامه هايي كه با سرقت علمي جمع بندي مي شوند يكي از مشكلات جدي در جوامع دانشگاهي به شمار مي رود.
هدف از اين پايان نامه ارائه ي الگوريتمي براي تشخيص سرقت علمي در حجم بالاي متون فارسي مي باشد به گونه اي كه بتوان اصالت نوشتاري يك مقاله ي علمي را با دقت كافي تعيين نمود. رويه ي معمول در اغلب روشهاي موجود استخراج يك سري ويژگيهاي از قبل تعريف شده از متن و دسته بندي متون بر اساس آنها مي باشد، ولي اين ويژگي ها نمي توانند به صورت كامل تمام پارامترهاي متن را مدلسازي نمايند. روش ارائه شده در اين پايان نامه برخلاف روشهاي سنتي، با در نظر گرفتن داده هاي آموزشي، سعي در يادگيري بهترين ويژگي بر اساس داده هاي موجود مي نمايد. بدين منظور يك معماري چندلايه مبتني بر شبكه هاي بازگشتي طراحي و پياده سازي شده است كه با دريافت داده هاي آموزشي و تجزيه وتحليل خودكار آنها، ساختارهاي موجود در متون را بدون ناظر آموزش مي بيند. در معماري پيشنهادي از يك خودرمز كننده براي يادگيري ويژگيهاي سراسري (مستقل از محل قرارگيري) و از يك شبكه ي عصبي بازگشتي به نام حافظه ي كوتاه مدت طولاني براي يادگيري ويژگيهاي محلي (وابسته به محل قرارگيري) استفاده شده است. قابليت يادگيري بالاي بازنمايي كلمات توسط خودرمزكننده و توانايي مدل كردن موقعيت قرارگيري كلمات دركنار هم در يك متن توسط شبكه ي عصبي بازگشتي مي تواند موارد سرقت علمي را به نحو مناسبي تشخيص دهد. روش ارائه شده بر روي مجموعه داده ي محك سميم مورد آموزش و آزمون قرارگرفته است و نتايج نشان مي دهد در موارد سرقت علمي با حفظ ساختار از كارايي بالاتري برخوردار مي باشد.
-
تاريخ ورود اطلاعات
1396/12/08
-
تاريخ بهره برداري
2/27/2018 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مريم رهنما
-
چكيده به لاتين
Scientific quotation without referencing the original documents is called plagiarism. Although plagiarism has a long history, media development and accessibility of communication utilities made its growth faster within the last decades. Text plagiarism is more often in comparison with other formats and plagiarism in articles and dissertations is one of the crucial problems among academic societies.
This dissertation aims at introducing an algorithm to recognize plagiarism in high volume Farsi texts in order to determine the authenticity of an academic article. Common approach in most of the extant methods is to extract some predefined features and to sort texts based on them, but these features cannot model all text parameters comprehensively. Unlike the traditional approaches, the proposed approach considering learning data attempts to learn best feature based on the available data. A multilayer architecture based on recursive network is designed and implemented that finds text structure without supervision by receiving and automatic analysis of the learning data. In the proposed architecture, an auto-encoder for learning universal features (independent of the location) and a recursive neural network named long short term memory for learning local features (dependent to the location) are utilized. High learning ability in word representation by auto-encoder and word location modeling in texts by recursive neural network can detect academic plagiarism in an appropriate manner. The proposed approach is tested on Mahak Samim data set and resulted in higher performance in non-accidental academic plagiarism in comparison with other available approaches.
-
لينک به اين مدرک :