-
شماره ركورد
23411
-
پديد آورنده
ياسمين واشقاني فراهاني
-
عنوان
ارائه الگوريتمي مبتني بر گراف و مستقل از زبان براي ابهامزدايي معناي واژگان
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر/نرم افزار
-
سال تحصيل
1399-1400
-
تاريخ دفاع
1399/11/01
-
استاد راهنما
جناب آقاي دكتر بهروز مينايي بيدگلي
-
دانشكده
كامپيوتر
-
چكيده
ابهامزدايي معناي واژگان يكي از شاخههاي مهم در پردازش زبان طبيعي است. واژگان با توجه به محتوايي كه در آن قرار ميگيرند، ميتوانند معاني متعددي داشته باشند كه به آن چندمعنايي ميگويند. انسان داراي توانايي ذاتي در تشخيص معناي صحيح واژگان است، اما يك سيستم بر اساس پردازش زبان طبيعي كار ميكند. مسئلهي يافتن معناي صحيح واژهي چندمعنايي با توجه به محتواي متن را ابهامزدايي معناي واژگان ميگويند. براي حل اين مسئله روشها و الگوريتمهاي متعددي ارائه شده است كه هر كدام مزايا و معايب خاص خود را دارند. روش پيشنهادي ما در اين پژوهش، ارائهي الگوريتمي مبتني بر گراف است كه بر اساس رهيافت دانشمحور و با بهرهگيري از فارسنت كه به عنوان يكي از بهترين پايگاه دادههاي واژگاني در زبان فارسي شناخته شده است، به ابهامزدايي معناي واژگان ميپردازد. در روش ارائه شده با استفاده از واژگان پيرامون كلمهي مبهم و اجزاي كلام آنها، پس از اتصال به فارسنت و استخراج روابط بين مجموعههاي ترادف، به معاني واژگان مبهم امتيازهايي را اختصاص ميدهد و در نهايت معنايي را كه بالاترين امتياز را به خود اختصاص داده به عنوان خروجي باز ميگرداند. روش پيشنهادي در مقايسه با ديگر الگوريتم مبتني بر گراف ارائه شده، در پيكرهي متني همشهري 0.8% و نامهي حضرت علي (ع) به مالك اشتر 1.5% افزايش دقت داشته است. همچنين اين الگوريتم در مقايسه با ساير الگوريتمهاي ابهامزدايي بر مبناي رهيافت مبتني بر دانش، با اختلاف، نتيجهي بهتري را به دست آورده است.
-
تاريخ ورود اطلاعات
1400/02/02
-
عنوان به انگليسي
Proposing a graph-based and language-independent algorithm for word sense disambiguation
-
تاريخ بهره برداري
1/21/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
ياسمين واشقاني فراهاني
-
چكيده به لاتين
Word sense disambiguation is one of the essential branches of natural language processing. Words can have much sense depending on the content they contain, which is called polysemy. Man has an innate ability to recognize the correct sense of words, but the system works based on natural language processing. The problem of finding the right meaning of a polysemous word according to the context is called word sense disambiguation. Several methods and algorithms have been proposed to solve this problem, each of which has its advantages and disadvantages. Our proposed method in this research is to present a graph-based algorithm based on the knowledge-based approach, using FarsNet, which is considered as one of the best sources of lexical knowledge in Persian, to disambiguate the sense of words. The proposed method assigns scores to the meanings of the ambiguous word using the words around the ambiguous word and their part of speech features, after connecting to FarsNet and extracting the synsets' relations. Finally, it displays the sense with the highest scores output. The proposed method, compared to other graph-based algorithms, has a 0.8% increase in the textual body of Hamshahri and a 1.5% increase in the letter of Imam Ali (as) to Malik Ashtar. Also, compared to other knowledge-based ambiguity algorithms, it has achieved a better result with a difference.
-
كليدواژه هاي فارسي
ابهامزدايي معناي واژگان , مبتني بر گراف , دانشمحور , فارسنت
-
كليدواژه هاي لاتين
word sense disambiguation , graph-based , knowledge-based , FarsNet
-
لينک به اين مدرک :