آرمان آجداني

عنوان

كاربرد استخراج كسره اضافه در تشخيص موجوديت هاي نامدار در زبان فارسي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

هوش مصنوعي و رباتيكز

سال تحصيل

1395 - 1399

تاريخ دفاع

1398/11/28

استاد راهنما

دكتر مرتضي آنالويي

دانشكده

كامپيوتر

چكيده

گسترش استفاده از نرم‌افزارهايي كه رابط كاربري هوشمند در تعامل با انسان‌ها دارند باعث افزايش پژوهش‌ها در زمينه‌ي پردازش زبان طبيعي براي تحليل و پردازش زبان انسان‌ها شده‌است. از جمله مسائل پردازش زبان تشخيص موجوديت‌هاي نامدار است كه به عنوان پيش‌زمينه‌ي بسياري از مسائل پردازش زبان مانند ترجمه ماشيني، پرسش پاسخ استفاده مي‌شود. تشخيص موجوديت‌هاي نامدار به يافتن كلمات خاصي مانند اسم سازمان‌ها ، اسم شهرها و كشورها و اسم اشخاص در متن گفته مي‌شود. تشخيص اين كلمات در زبان فارسي دچار مشكلاتي است از قبيل عدم نشانه‌ي خاص براي اسم‌هاي خاصي كه در جملات استفاده مي‌شوند كه به عنوان مثال در زبان انگليسي با حروف بزرگ آغاز مي‌‌شوند اما در زبان فارسي نشانه‌ي خاصي ندارند و تشخيص آن‌ها مشكل را مي‌كند. نكته‌ي بعد عدم نگارش كسره‌ي اضافه در متون فارسي است كه تشخيص حدود عبارات اسمي را مشكل مي‌كند. در اين پژوهش با استخراج كسره‌ي اضافه از متن جملات فارسي و اضافه كردن ويژگي كسره‌ي اضافه به مدل تشخيص موجوديت‌هاي نامدار، مدلي ارائه داديم كه عملكرد بهتري نسبت به مدل‌هاي مشابه در تشخيص حدود عبارات اسمي دارد و برچسب‌هايي كه به دليل عدم تشخيص كسره‌ي اضافه به اشتباه تشخيص داده مي‌شدند در اين مدل با خطاي كمتري قابل تشخيص هستند. ويژگي ديگر مدل كاهش خطاي تشخيص كلماتي است كه هم در عبارات موجوديت نامدار هم استفاده مي‌شوند و هم به صورت جداگانه در جملات زبان فارسي استفاده مي‌شوند كه در آن‌جا معناي موجوديت خاص ندارند و در عبارات اسمي معنا پيدا مي‌كنند و در مدل ارائه شده به دليل تشخيص وابستگي‌ها بين كلمات همسايه‌ي كلمه‌ي در حال بررسي توانايي رفع اين مشكل وجود دارد. در نهايت مدل تشخيص موجوديت‌هاي نامدار ارائه شده با استفاده از ويژگي كسره‌ي اضافه عملكرد بهتري نسبت به مدل‌هاي مشابه داشته و به طور ميانگين 3 تا 4 درصد در برچسب‌هاي موجوديت نامدار از مدل‌هاي مشابه دقت بيشتري دارد.

تاريخ ورود اطلاعات

1399/10/14

عنوان به انگليسي

An Application on extracting Ezafe in Named Entity Recognition in Persian Languag

تاريخ بهره برداري

2/17/2020 12:00:00 AM

دانشجوي وارد كننده اطلاعات

آرمان آجداني

Name: آرمان آجداني
Author: آرمان آجداني

چكيده به لاتين

In recent years, deep learning has attracted the attention of many machine learning researchers. Researchers used neural network knowledge to create a network with different architecture. They train these networks and evaluate the performance of these networks in distinct machine learning tasks. One of the most interesting and applicable tasks in NLP is Named Entity Recognition. Named entity recognition is a process in which the people's names, names of places and organizations in a text are identified. named entity recognition plays an important role in many NLP tasks such as semantic role labeling, question answering, summarization, machine translation, etc. Named entity recognition in the Persian language is far more complex and more difficult than English, In English texts usually, proper nouns begin with capital letters and this feature makes it easy to identify named entities, but this feature is absent in Persian language texts. another problem with the Persian language in this task is people usually don't write Ezafe in their writings and this makes it hard to extract compound nouns. In this paper firstly, we propose a model for the detection of Ezafe in Persian sentences and then we use this feature for extraction Named entity recognition in the Persian language. The results showed using Ezafe improves the accuracy of the model by 6 percent.

كليدواژه هاي فارسي

موجوديت هاي نامدار , پردازش طبيعي زبان , كسره ي اضافه

كليدواژه هاي لاتين

Named Entity Recognition , Deep Learning , Natural Language Processing , Ezafe

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=22953&Field=0&DTC=6