سيد ابوالفضل مهدي‌زاده صوفياني

عنوان

تشخيص موجوديت‌هاي نامدار فارسي با استفاده از شبكه‌هاي عصبي عميق

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

هوش مصنوعي و رباتيك

تاريخ دفاع

شهريور ماه 1395

استاد راهنما

دكتر مرتضي آنالويي

دانشكده

كامپيوتر

چكيده

چكيده يادگيري عميق عرصه‌ي جديدي از پژوهش‌ها در زمينه‌ي يادگيري ماشين است. از يادگيري عميق در حيطه‌هاي مختلف پردازش سيگنال‌ها و داده‌ها استفاده شده است. مدل‌هاي عميق (شبكه‌هاي عصبي عميق) در بعضي از مسائل مانند پردازش تصوير و بينايي ماشين نسبت به روش‌هاي سنتي عملكرد بسيار چشم‌گيري داشته‌اند. از يادگيري عميق در كاربردهاي مختلف پردازش زبان طبيعي استفاده شده است. گروه‌هاي پژوهشي بسياري در اين زمينه فعاليت دارند. در بعضي زمينه‌ها مانند مدل‌سازي زبان موفقيت‌هاي چشمگيري بدست آمده است. در زمينه‌هاي ديگر نيز نتايج مناسب هستند. در اين پژوهش يك معماري عميق براي تشخيص موجوديت‌هاي نامدار فارسي ارائه مي‌شود. اين معماري مبتني بر شبكه‌هاي عصبي برگشتي است. همچنين در اين معماري چندين لايه براي يادگيري بردارهاي واژگان وجود دارد. معماري (مدل) پيشنهادي با استفاده از پيكرۀ موجوديت‌هاي نامدار فارسي آموزش داده شده و عملكرد آن مورد ارزيابي قرار گرفته است. آزمايش‌ها نشان مي‌دهند با استفاده از متن خام و روش‌هاي ايجاد بردار واژگان مي‌توان عملكرد روش پيشنهادي را به شدت افزايش داد؛ همچنين مي‌توان از يك معماري واحد براي تشخيص برچسب اجزاي سخن و تشخيص موجوديت‎هاي نامدار فارسي بهره برد. در اين پژوهش از روش‌هاي پيشنهادي براي سايز زبان‌ها استفاده شده است. اين موضوع نمايانگر كارايي روش‌هاي پيشنهادي براي سايز زبان‌ها در زبان فارسي است. همچنين يكي ديگر از نتايج اين پژوهش، اهميت ويژگي‌هاي ظاهري و ريخت‌شناسي واژگان فارسي است. واژه‌هاي كليدي: يادگيري عميق، شبكه‌هاي عصبي عميق، شبكه‌ي برگشتي، موجوديت نامدار، تعبيه واژه

تاريخ ورود اطلاعات

1396/01/16

تاريخ بهره برداري

1/1/1900 12:00:00 AM

دانشجوي وارد كننده اطلاعات

اعظم صادقي

چكيده به لاتين

Abstract Deep Learning is a new field in machine learning researches. It has been used in a great extent of signal and data processing tasks. Deep models (deep neural networks) had a very tremendous results in some tasks like image processing and machine vision. These models also have been used in different Natural Language Processing tasks. Various research groups are active in this field. They have reach impressive improvement in language modeling. In other tasks the results are promising. In this thesis, a deep architecture for Persian Named Entity Recognition has been proposed. This architecture is based on recurrent neural networks, also there is several layers for learning word vectors. The proposed architecture (model) has been trained and evaluated with Persian Named Entity Corpus. Experiments shows that using unannotated text and producing word embeddings can greatly increase models performance. It has been shown that a unified deep architecture can be used for Persian Part Of Speech Tagging and Named Entity Recognition. In this study, suggested methods for other languages has been used. It shows the effectiveness of suggested methods in other languages for Persian Named Entity Recognition. Also results shows the importance of syntax and morphological features of Persian words. Keywords: Deep Learning, Deep Neural Networks, Recurrent Network, Named Entity, Word Embedding

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=16999&Field=0&DTC=6