-
شماره ركورد
15103
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
15103
-
پديد آورنده
مهسا خراساني
-
عنوان
گسترش و توسعهي خودكار شبكههاي معنايي كلمات فارسي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر-گرايش هوش مصنوعي و رباتيك
-
سال تحصيل
شهريورماه 1394
-
تاريخ دفاع
شهريورماه 1394
-
استاد راهنما
آقاي دكتر بهروز مينايي
-
چكيده
چكيده
شبكهمعنايي وردنت يك منبع دانشلغوي است كه از ملزومات اصلي در كاربردهاي پردازش زبان طبيعي ميباشد. توسعه و غنيسازي خودكار اين شبكهها از موضوعاتي است كه با چالشهاي فراواني روبرو است.
در اين تحقيق روشي خودكار براي غنيسازي وردنت فارسي ارائه شده است. بهاين منظور، پس از مطالعهي روشهاي پردازشي موجود در مطالعات پيشين، استخراج گروههاي معنايي كلمات فارسي از منابع زباني زبان فارسي، انجام گرفته است.
در تحقيق حاضر، در گام اول با هدف استخراج گروههاي معنايي كلمات از پيكرهي واژگان زبان فارسي با ايده گرفتن از نظريهي شباهت توزيعي ، شبيهترين كلمات به هر كلمه در پيكرهي واژگان مورد نظر، تعيين ميشوند. سپس براي دستهبندردهبندي معنايي كلمات از روش شناختهشدهي CBC استفاده گرديدشد. بهمنظور ارتقاي دقت مجموعهي شبيهترين كلمات، يك ضريب پيشنهادي در محاسبهي شباهت معنايي كلمات اعمال گرديد. سپس بهمنظور ارتقاي دقت و كيفيت روابط استخراجي، از يك روش خوشهبندي مبتني بر گراف استفاده شد كه با در نظر گرفتن دقت دادههاي ورودي به بهينهترين نتايج منجر ميگردد ميشود. در گام دوم، گروههاي هممعناي كلمات از فرهنگ واژگان مترادف زبان فارسي با استفاده از روش خوشهبندي مبتني بر گراف استخراج ميشوند.
بهمنظور ارزيابي نتايج حاصل شده، گروههاي معنايي استخراج شده بهصورت دستي مورد بررسي قرار گرفتند كه دقت 69.05٪ براي گروههاي معنايي حاصل از روش CBC و دقت 80.25٪ براي گروههاي معنايي حاصل از روش خوشهبندي مبتني بر گراف و دقت 100٪ براي گروههاي هممعناي استخراج شده از فرهنگ كلمات مترادف حاصل شد.
واژههاي كليدي: غنيسازي خودكار شبكه معنايي كلمات زبان فارسي، استخراج گروههاي معنايي كلمات، خوشهبندي CBC، خوشهبندي مبتني بر گراف، منابع زباني ساختيافته ونيمه ساختيافته
-
لينک به اين مدرک :