• شماره ركورد
    13897
  • شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
    13897
  • پديد آورنده

    عاطفه پاكزاد

  • عنوان
    ارائه و بهسازي مدل توأم برچسب‌زني اجزاي سخن و تجزيه‌ي وابستگي زبان فارسي
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    كامپيوتر - هوش مصنوعي و رباتيك
  • سال تحصيل
    آبان ماه 1393
  • تاريخ دفاع
    آبان ماه 1393
  • استاد راهنما
    دكتر بهروز مينايي بيدگلي
  • چكيده
    چكيده تجزيه‌ي وابستگي راهي براي تجزيه‌ي نحوي زبان طبيعي است كه به صورت خودكار به تجزيه و تحليل ساختار وابستگي جملات پرداخته و براي هر جمله‌ي ورودي يك گراف وابستگي ايجاد مي‌كند. برچسب‌زني اجزاي سخن براي انجام تجزيه‌ي وابستگي يك پيش‌نياز است. عموما تجزيه‌گرهاي وابستگي به صورت مرحله‌اي پيوسته وظايف برچسب‌زني و تجزيه‌ي وابستگي را به صورت دو گام متوالي انجام مي‌دهند. در اين مدل‌ها خطاي ناشي از برچسب‌زني در تجزيه‌ي وابستگي انتشار مي‌يابد، همچنين در حين برچسب‌زني از اطلاعات مفيد نحوي استفاده نمي‌كند. هدف از ارائه‌ي روش‌هاي توأم، كاهش همزمان خطاي هر دو وظيفه‌ي برچسب‌زني اجزاي سخن و تجزيه‌ي وابستگي است. در اين پژوهش براي اولين بار مدل‌ توأم بر روي زبان فارسي با استفاده از نرم‌افزار Corbit مورد آزمايش قرار گرفته و ويژگي‌هاي مدل بر روي زبان فارسي بهينه‌سازي شده كه سبب بهبود در دقت مدل توأم شده‌است. نرم‌افزار Corbit پياده‌سازي يك روش توأم مبتني بر گذار براي وظايف تقسيم‌بندي كلمه، برچسب‌زني اجزاي سخن و تجزيه‌ي وابستگي است. در اين پژوهش دقت توأم برچسب‌زني اجزاي سخن و اتصال بدون برچسب تجزيه‌ي وابستگي براي برچسب‌هاي درشت بر روي داده‌ي آزمون برابر 85.59 درصد و براي برچسب‌هاي ريز 84.24 درصد به‌دست آمده است. واژه‌هاي كليدي: مدل توأم ، اجزاي سخن ، تجزيه‌ي وابستگي ، زبان فارسي