-
شماره ركورد
7127
-
پديد آورنده
محمدمهدي شيباني
-
عنوان
پيادهسازي روشي مستقل از زبان براي استخراج آزاد اطلاعات و بوميسازي آن براي زبان فارسي
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1399
-
استاد راهنما
دكتر بهروز مينائي بيدگلي - دكتر عادل تركمان رحماني
-
دانشجوي وارد كننده اطلاعات
محمدمهدي شيباني
-
تاريخ ورود اطلاعات
1399/11/28
-
دانشكده
كامپيوتر
-
عنوان به انگليسي
Implement a language-independent method for open information extraction and implement and localize it for Persian language
-
چكيده
با توجه به حجم عظيم دانش و اطلاعات بشر و رشد روزافزون مستندات در زمينههاي مختلف، پردازش زبانهاي طبيعي و تبديل متون به دانش قابل فهم براي ماشين، مورد توجه قرار گرفته است. با استفاده از سيستمهاي استخراج اطلاعات ميتوان بطور خودكار پايگاه دانشي ساختيافته از متون ايجاد كرد. در واقع هدف يك سيستم استخراج اطلاعات، استخراج اطلاعات از متون غيرساختيافته و نمايش آنها در قالبهاي
ساختيافته مانند سهگانههاي RDF ميباشد. در اين پاياننامه، ابتدا روشي مستقل از زبان براي استخراج آزاد اطلاعات از متون پيشنهاد شده و سپس براي زبان فارسي بوميسازي و پيادهسازي شده است كه در آن استخراج اطلاعات در سطح جمله و بر پايه درخت وابستگي جهاني صورت ميگيرد، كه براي زبان فارسي از درخت وابستگي جهاني زبان فارسي به عنوان مفسر برنامه استفاده ميشود.
با توجه به اين كه در پژوهشهاي قبلي راهكار استفاده از regex پيشنهاد شده، در اين پاياننامه با استفاده از ابزار چندزبانه PredPatt به استخراج آزاد اطلاعات ميپردازيم.
-
كليدواژه ها
پردازش زبان طبيعي , استخراج آزاد , استخراج آزاد اطلاعات
-
لينک به اين مدرک :