شماره ركورد
16999
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
16999
پديد آورنده
سيد ابوالفضل مهديزاده صوفياني
عنوان
تشخيص موجوديتهاي نامدار فارسي با استفاده از شبكههاي عصبي عميق
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
هوش مصنوعي و رباتيك
تاريخ دفاع
شهريور ماه 1395
استاد راهنما
دكتر مرتضي آنالويي
دانشكده
كامپيوتر
چكيده
چكيده
يادگيري عميق عرصهي جديدي از پژوهشها در زمينهي يادگيري ماشين است. از يادگيري عميق در حيطههاي مختلف پردازش سيگنالها و دادهها استفاده شده است. مدلهاي عميق (شبكههاي عصبي عميق) در بعضي از مسائل مانند پردازش تصوير و بينايي ماشين نسبت به روشهاي سنتي عملكرد بسيار چشمگيري داشتهاند.
از يادگيري عميق در كاربردهاي مختلف پردازش زبان طبيعي استفاده شده است. گروههاي پژوهشي بسياري در اين زمينه فعاليت دارند. در بعضي زمينهها مانند مدلسازي زبان موفقيتهاي چشمگيري بدست آمده است. در زمينههاي ديگر نيز نتايج مناسب هستند.
در اين پژوهش يك معماري عميق براي تشخيص موجوديتهاي نامدار فارسي ارائه ميشود. اين معماري مبتني بر شبكههاي عصبي برگشتي است. همچنين در اين معماري چندين لايه براي يادگيري بردارهاي واژگان وجود دارد. معماري (مدل) پيشنهادي با استفاده از پيكرۀ موجوديتهاي نامدار فارسي آموزش داده شده و عملكرد آن مورد ارزيابي قرار گرفته است.
آزمايشها نشان ميدهند با استفاده از متن خام و روشهاي ايجاد بردار واژگان ميتوان عملكرد روش پيشنهادي را به شدت افزايش داد؛ همچنين ميتوان از يك معماري واحد براي تشخيص برچسب اجزاي سخن و تشخيص موجوديتهاي نامدار فارسي بهره برد.
در اين پژوهش از روشهاي پيشنهادي براي سايز زبانها استفاده شده است. اين موضوع نمايانگر كارايي روشهاي پيشنهادي براي سايز زبانها در زبان فارسي است. همچنين يكي ديگر از نتايج اين پژوهش، اهميت ويژگيهاي ظاهري و ريختشناسي واژگان فارسي است.
واژههاي كليدي: يادگيري عميق، شبكههاي عصبي عميق، شبكهي برگشتي، موجوديت نامدار، تعبيه واژه
تاريخ ورود اطلاعات
1396/01/16
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
اعظم صادقي
چكيده به لاتين
Abstract
Deep Learning is a new field in machine learning researches. It has been used in a great extent of signal and data processing tasks. Deep models (deep neural networks) had a very tremendous results in some tasks like image processing and machine vision.
These models also have been used in different Natural Language Processing tasks. Various research groups are active in this field. They have reach impressive improvement in language modeling. In other tasks the results are promising.
In this thesis, a deep architecture for Persian Named Entity Recognition has been proposed. This architecture is based on recurrent neural networks, also there is several layers for learning word vectors. The proposed architecture (model) has been trained and evaluated with Persian Named Entity Corpus.
Experiments shows that using unannotated text and producing word embeddings can greatly increase models performance. It has been shown that a unified deep architecture can be used for Persian Part Of Speech Tagging and Named Entity Recognition.
In this study, suggested methods for other languages has been used. It shows the effectiveness of suggested methods in other languages for Persian Named Entity Recognition. Also results shows the importance of syntax and morphological features of Persian words.
Keywords: Deep Learning, Deep Neural Networks, Recurrent Network, Named Entity, Word Embedding