• شماره ركورد
    11072
  • شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
    11072
  • پديد آورنده

    مجتبي خلاش

  • عنوان
    ساز و كاري براي كشف تأثير ويژگي هاي مختلف ساخت واژي و صرفي بر روي تجزية وابستگي زبان فارسي
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    كامپيوتر - هوش مصنوعي و رباتيك
  • سال تحصيل
    آبان ماه 1391
  • تاريخ دفاع
    آبان ماه 1391
  • استاد راهنما
    دكتر بهروز مينايي بيدگلي
  • چكيده
    چكيده سامانه‌هاي مبتني بر داده به راحتي مي‌توانند به ساير زبان‌ها يا دامنه‌ها منتقل شود. به همين دليل در تجزية وابستگي نيز اقبال به روش‌هاي «مبتني بر داده» بيش از روش‌هاي «مبتني بر دستور» بوده است. تنها پيش‌نياز اين روش‌ها وجود پيكرة وابستگي شامل جملات و درخت وابستگي متناظر با آن است كه تهية آن امري پرهزينه و زمان‌بر است. با اين وجود تاكنون براي حدود 30 زبان پيكرة وابستگي تهيه شده كه زبان فارسي نيز جزو اين دسته از زبان‌هاست. با وجود صحت بالاي تجزية وابستگي در زبان انگليسي، اعمال الگوريتم‌هاي موجود بر روي دسته‌اي از زبان‌ها اغلب منجر به افت صحت مي‌شود كه دليل اين امر را مي‌توان در پررنگ‌تر بودن عامل بي‌ترتيبي و غني بودن ساخت‌واژه‌ها در زبان مقصد نسبت به زبان انگليسي دانست. اين بدان معناست كه سامانه‌هاي مبتني بر داده نيازمند انتخاب خصوصيات و تنظيم دقيق پارامترها به منظور رسيدن به كارايي بهينه هستند. اين امر كار پيچيده‌اي است كه نيازمند دانش خاص از سامانه و خواص زبان مقصد است. در اين پايان‌نامه ابتدا مروري بر تلاش‌هاي انجام‌شده براي برخورد با اين مسئله در ساير زبان‌ها خواهيم پرداخت و پس از ترسيم روند كاري، سعي شده تا اين روند بر روي زبان فارسي انجام و عوامل تأثيرگذار بر كاهش صحت تجزيه شناسايي شوند. سپس مجموعه‌اي از 10 خصوصيت ساخت‌واژي و مفهومي مورد بررسي قرار گرفته و ضمن بررسي تأثير هر خصوصيت به صورت جداگانه، بهترين تركيب اين خصوصيات ارائه شده است. واژه‌هاي كليدي: تجزية وابستگي، خصوصيات ساخت‌واژي و صرفي، پيكرة وابستگي.