-
شماره ركورد
22953
-
پديد آورنده
آرمان آجداني
-
عنوان
كاربرد استخراج كسره اضافه در تشخيص موجوديت هاي نامدار در زبان فارسي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
هوش مصنوعي و رباتيكز
-
سال تحصيل
1395 - 1399
-
تاريخ دفاع
1398/11/28
-
استاد راهنما
دكتر مرتضي آنالويي
-
دانشكده
كامپيوتر
-
چكيده
گسترش استفاده از نرمافزارهايي كه رابط كاربري هوشمند در تعامل با انسانها دارند باعث افزايش پژوهشها در زمينهي پردازش زبان طبيعي براي تحليل و پردازش زبان انسانها شدهاست. از جمله مسائل پردازش زبان تشخيص موجوديتهاي نامدار است كه به عنوان پيشزمينهي بسياري از مسائل پردازش زبان مانند ترجمه ماشيني، پرسش پاسخ استفاده ميشود.
تشخيص موجوديتهاي نامدار به يافتن كلمات خاصي مانند اسم سازمانها ، اسم شهرها و كشورها و اسم اشخاص در متن گفته ميشود. تشخيص اين كلمات در زبان فارسي دچار مشكلاتي است از قبيل عدم نشانهي خاص براي اسمهاي خاصي كه در جملات استفاده ميشوند كه به عنوان مثال در زبان انگليسي با حروف بزرگ آغاز ميشوند اما در زبان فارسي نشانهي خاصي ندارند و تشخيص آنها مشكل را ميكند. نكتهي بعد عدم نگارش كسرهي اضافه در متون فارسي است كه تشخيص حدود عبارات اسمي را مشكل ميكند.
در اين پژوهش با استخراج كسرهي اضافه از متن جملات فارسي و اضافه كردن ويژگي كسرهي اضافه به مدل تشخيص موجوديتهاي نامدار، مدلي ارائه داديم كه عملكرد بهتري نسبت به مدلهاي مشابه در تشخيص حدود عبارات اسمي دارد و برچسبهايي كه به دليل عدم تشخيص كسرهي اضافه به اشتباه تشخيص داده ميشدند در اين مدل با خطاي كمتري قابل تشخيص هستند. ويژگي ديگر مدل كاهش خطاي تشخيص كلماتي است كه هم در عبارات موجوديت نامدار هم استفاده ميشوند و هم به صورت جداگانه در جملات زبان فارسي استفاده ميشوند كه در آنجا معناي موجوديت خاص ندارند و در عبارات اسمي معنا پيدا ميكنند و در مدل ارائه شده به دليل تشخيص وابستگيها بين كلمات همسايهي كلمهي در حال بررسي توانايي رفع اين مشكل وجود دارد.
در نهايت مدل تشخيص موجوديتهاي نامدار ارائه شده با استفاده از ويژگي كسرهي اضافه عملكرد بهتري نسبت به مدلهاي مشابه داشته و به طور ميانگين 3 تا 4 درصد در برچسبهاي موجوديت نامدار از مدلهاي مشابه دقت بيشتري دارد.
-
تاريخ ورود اطلاعات
1399/10/14
-
عنوان به انگليسي
An Application on extracting Ezafe in Named Entity Recognition in Persian Languag
-
تاريخ بهره برداري
2/17/2020 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
آرمان آجداني
-
چكيده به لاتين
In recent years, deep learning has attracted the attention of many machine learning researchers. Researchers used neural network knowledge to create a network with different architecture. They train these networks and evaluate the performance of these networks in distinct machine learning tasks.
One of the most interesting and applicable tasks in NLP is Named Entity Recognition. Named entity recognition is a process in which the people's names, names of places and organizations in a text are identified. named entity recognition plays an important role in many NLP tasks such as semantic role labeling, question answering, summarization, machine translation, etc. Named entity recognition in the Persian language is far more complex and more difficult than English, In English texts usually, proper nouns begin with capital letters and this feature makes it easy to identify named entities, but this feature is absent in Persian language texts. another problem with the Persian language in this task is people usually don't write Ezafe in their writings and this makes it hard to extract compound nouns.
In this paper firstly, we propose a model for the detection of Ezafe in Persian sentences and then we use this feature for extraction Named entity recognition in the Persian language. The results showed using Ezafe improves the accuracy of the model by 6 percent.
-
كليدواژه هاي فارسي
موجوديت هاي نامدار , پردازش طبيعي زبان , كسره ي اضافه
-
كليدواژه هاي لاتين
Named Entity Recognition , Deep Learning , Natural Language Processing , Ezafe
-
لينک به اين مدرک :