• شماره ركورد
    7127
  • پديد آورنده

    محمدمهدي شيباني

  • عنوان
    پياده‌سازي روشي مستقل از زبان براي استخراج آزاد اطلاعات و بومي‌سازي آن براي زبان فارسي
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي كامپيوتر
  • سال فارغ التحصيلي
    1399
  • استاد راهنما
    دكتر بهروز مينائي بيدگلي - دكتر عادل تركمان رحماني
  • دانشجوي وارد كننده اطلاعات

    محمدمهدي شيباني

  • تاريخ ورود اطلاعات
    1399/11/28
  • دانشكده
    كامپيوتر
  • عنوان به انگليسي
    Implement a language-independent method for open information extraction and implement and localize it for Persian language
  • چكيده
    با توجه به حجم عظيم دانش و اطلاعات بشر و رشد روزافزون مستندات در زمينه‌هاي مختلف، پردازش زبان‌هاي طبيعي و تبديل متون به دانش قابل فهم براي ماشين، مورد توجه قرار گرفته است. با استفاده از سيستم‌هاي استخراج اطلاعات مي‌توان بطور خودكار پايگاه دانشي ساخت‌يافته از متون ايجاد كرد. در واقع هدف يك سيستم استخراج اطلاعات، استخراج اطلاعات از متون غيرساخت‌يافته و نمايش آن‌ها در قالب‌هاي ساخت‌يافته مانند سه‌گانه‌هاي RDF مي‌باشد. در اين پايان‌نامه، ابتدا روشي مستقل از زبان براي استخراج آزاد اطلاعات از متون پيشنهاد شده و سپس براي زبان فارسي بومي‌سازي و پياده‌سازي شده است كه در آن استخراج اطلاعات در سطح جمله و بر پايه درخت وابستگي جهاني صورت مي‌گيرد، كه براي زبان فارسي از درخت وابستگي جهاني زبان فارسي به عنوان مفسر برنامه استفاده مي‌شود. با توجه به اين كه در پژوهش‌هاي قبلي راهكار استفاده از regex پيشنهاد شده، در اين پايان‌نامه با استفاده از ابزار چندزبانه PredPatt به استخراج آزاد اطلاعات مي‌پردازيم.
  • كليدواژه ها
    پردازش زبان طبيعي , استخراج آزاد , استخراج آزاد اطلاعات