• شماره ركورد
    23411
  • پديد آورنده

    ياسمين واشقاني فراهاني

  • عنوان
    ارائه الگوريتمي مبتني بر گراف و مستقل از زبان براي ابهام‌زدايي معناي واژگان
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر/نرم افزار
  • سال تحصيل
    1399-1400
  • تاريخ دفاع
    1399/11/01
  • استاد راهنما
    جناب آقاي دكتر بهروز مينايي بيدگلي
  • دانشكده
    كامپيوتر
  • چكيده
    ابهام‌زدايي معناي واژگان يكي از شاخه‌هاي مهم در پردازش زبان طبيعي است. واژگان با توجه به محتوايي كه در آن قرار مي‌گيرند، مي‌توانند معاني متعددي داشته باشند كه به آن چندمعنايي مي‌گويند. انسان داراي توانايي ذاتي در تشخيص معناي صحيح واژگان است، اما يك سيستم بر اساس پردازش زبان طبيعي كار مي‌كند. مسئله‌ي يافتن معناي صحيح واژه‌ي چندمعنايي با توجه به محتواي متن را ابهام‌زدايي معناي واژگان مي‌گويند. براي حل اين مسئله روش‌ها و الگوريتم‌هاي متعددي ارائه شده است كه هر كدام مزايا و معايب خاص خود را دارند. روش پيشنهادي ما در اين پژوهش، ارائه‌ي الگوريتمي مبتني بر گراف است كه بر اساس رهيافت دانش‌محور و با بهره‌گيري از فارس‌نت كه به عنوان يكي از بهترين پايگاه داده‌هاي واژگاني در زبان فارسي شناخته شده است، به ابهام‌زدايي معناي واژگان مي‌پردازد. در روش ارائه شده با استفاده از واژگان پيرامون كلمه‌ي مبهم و اجزاي كلام آن‌ها، پس از اتصال به فارس‌نت و استخراج روابط بين مجموعه‌هاي ترادف، به معاني واژگان مبهم امتيازهايي را اختصاص مي‌دهد و در نهايت معنايي را كه بالاترين امتياز را به خود اختصاص داده به عنوان خروجي باز مي‌گرداند. روش پيشنهادي در مقايسه با ديگر الگوريتم مبتني بر گراف ارائه شده، در پيكره‌ي متني همشهري 0.8% و نامه‌ي حضرت علي (ع) به مالك اشتر 1.5% افزايش دقت داشته است. همچنين اين الگوريتم در مقايسه با ساير الگوريتم‌هاي ابهام‌زدايي بر مبناي رهيافت مبتني بر دانش، با اختلاف، نتيجه‌ي بهتري را به دست آورده است.
  • تاريخ ورود اطلاعات
    1400/02/02
  • عنوان به انگليسي
    Proposing a graph-based and language-independent algorithm for word sense disambiguation
  • تاريخ بهره برداري
    1/21/2022 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    ياسمين واشقاني فراهاني

  • چكيده به لاتين
    Word sense disambiguation is one of the essential branches of natural language processing. Words can have much sense depending on the content they contain, which is called polysemy. Man has an innate ability to recognize the correct sense of words, but the system works based on natural language processing. The problem of finding the right meaning of a polysemous word according to the context is called word sense disambiguation. Several methods and algorithms have been proposed to solve this problem, each of which has its advantages and disadvantages. Our proposed method in this research is to present a graph-based algorithm based on the knowledge-based approach, using FarsNet, which is considered as one of the best sources of lexical knowledge in Persian, to disambiguate the sense of words. The proposed method assigns scores to the meanings of the ambiguous word using the words around the ambiguous word and their part of speech features, after connecting to FarsNet and extracting the synsets' relations. Finally, it displays the sense with the highest scores output. The proposed method, compared to other graph-based algorithms, has a 0.8% increase in the textual body of Hamshahri and a 1.5% increase in the letter of Imam Ali (as) to Malik Ashtar. Also, compared to other knowledge-based ambiguity algorithms, it has achieved a better result with a difference.
  • كليدواژه هاي فارسي
    ابهام‌زدايي معناي واژگان , مبتني بر گراف , دانش‌محور , فارس‌نت
  • كليدواژه هاي لاتين
    word sense disambiguation , graph-based , knowledge-based , FarsNet