-
شماره ركورد
7706
-
پديد آورنده
رضا قهرماني
-
عنوان
پياده سازي يك الگوريتم استخراج رابطه از متون فارسي با استفاده از يادگيري عميق
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1400
-
استاد راهنما
دكتر بهروز مينايي بيدگلي
-
استاد مشاور
دكتر بهروز مينايي بيدگلي
-
دانشجوي وارد كننده اطلاعات
رضا قهرماني
-
تاريخ ورود اطلاعات
1400/12/09
-
دانشكده
مهندسي كامپيوتر
-
عنوان به انگليسي
Implementing an algorithm for extracting relationships from Persian texts using deep learning
-
چكيده
استخراج رابطه به عنوان يكي از اساسي ترين رويكردهاي استخراج اطلاعات شناخته ميشود كه وظيفه
استخراج اطلاعات معنايي روابط بين موجوديت ها در متن خام را برعهده دارد. استخراج رابطه در
پروژه هاي مربوط به سامانه هاي پرس و جو و ترجمه ماشيني كاربرد ويژه اي دارد. خروجي هر استخرا ج
رابطه به صورت يك سه تايي شامل فاعل، گزاره و مفعول ميباشد. رابطه بين موجوديت ها در يك متن
ميتواند شكلهاي مختلفي داشته باشد. در اين پژوهش ميخواهيم ضمن بررسي رويكردهاي يادگيري
عميق در استخراج رابطه، به تحليل و بررسي نتايج حاصل از مجموعه داد ه طلايي پروژه فارس بيس كي
بي پي براي دادگان درخت نحوي Seraji كه در دو نسخه ارائه شده است و دادگان درخت نحوي
PerDT كه بخش تشخيص موجوديت نامدار آن مبتني بر مدل BERT است، بپردازيم. خروجي
رابطه هاي جملات نيز از طريق الگوريتم PredPatt بدست آمده است. نتيجه انجام اين پژوهش، ارائه
يك سامانه استخراج رابطه با نام RePer بر اساس وابستگي هاي سراسري موجود در زبان فارسي است .
نتايج حاصل از اين پژوهش، نشان ميدهد نسخه دوم UDPipe در مدل Seraji با به كارگيري شبك ه-
هاي عصبي عميق توانسته پيشرفت قابل ملاحظه اي نسبت به نسخه اول داشته باشد. با وجود اينكه
انتظار داشتيم نتايج در مدل PerDT كه مبتني بر مدل BERT در بخش تشخيص موجوديت نامدار
است عملكرد بهتري داشته باشد، نسبت به دو نسخه Seraji نتايج خوبي حاصل نشد. با اين وجود
پيشنهادهايي براي رفع خطاها و بهبود نتايج در كارهاي آتي نيز ارائه شده است .
-
كليدواژه ها
پردازش زبان طبيعي , استخراج رابطه , استخراج اطلاعات
-
لينک به اين مدرک :