شماره ركورد
7127
پديد آورنده
محمدمهدي شيباني
عنوان
پيادهسازي روشي مستقل از زبان براي استخراج آزاد اطلاعات و بوميسازي آن براي زبان فارسي
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1399
استاد راهنما
دكتر بهروز مينائي بيدگلي - دكتر عادل تركمان رحماني
دانشجوي وارد كننده اطلاعات
محمدمهدي شيباني
تاريخ ورود اطلاعات
1399/11/28
دانشكده
كامپيوتر
عنوان به انگليسي
Implement a language-independent method for open information extraction and implement and localize it for Persian language
چكيده
با توجه به حجم عظيم دانش و اطلاعات بشر و رشد روزافزون مستندات در زمينههاي مختلف، پردازش زبانهاي طبيعي و تبديل متون به دانش قابل فهم براي ماشين، مورد توجه قرار گرفته است. با استفاده از سيستمهاي استخراج اطلاعات ميتوان بطور خودكار پايگاه دانشي ساختيافته از متون ايجاد كرد. در واقع هدف يك سيستم استخراج اطلاعات، استخراج اطلاعات از متون غيرساختيافته و نمايش آنها در قالبهاي
ساختيافته مانند سهگانههاي RDF ميباشد. در اين پاياننامه، ابتدا روشي مستقل از زبان براي استخراج آزاد اطلاعات از متون پيشنهاد شده و سپس براي زبان فارسي بوميسازي و پيادهسازي شده است كه در آن استخراج اطلاعات در سطح جمله و بر پايه درخت وابستگي جهاني صورت ميگيرد، كه براي زبان فارسي از درخت وابستگي جهاني زبان فارسي به عنوان مفسر برنامه استفاده ميشود.
با توجه به اين كه در پژوهشهاي قبلي راهكار استفاده از regex پيشنهاد شده، در اين پاياننامه با استفاده از ابزار چندزبانه PredPatt به استخراج آزاد اطلاعات ميپردازيم.
كليدواژه ها
پردازش زبان طبيعي , استخراج آزاد , استخراج آزاد اطلاعات