• شماره ركورد
    9387
  • شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
    9387
  • پديد آورنده

    معصومه مشايخي

  • عنوان
    معرفي معيار¬هايي براي ارزيابي پيكره موازي فارسي انگليسي هم¬تراز شده در سطح جمله
  • مقطع تحصيلي
    درجه كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر گرايش هوش مصنوعي و رباتيك
  • سال تحصيل
    بهمن ماه 1390
  • تاريخ دفاع
    بهمن ماه 1390
  • استاد راهنما
    دكتر مرتضي آنالويي ، دكتر بهروز مينايي
  • چكيده
    چكيده پيكره¬هاي دوزبانه يكي از منابع مهم براي كارها و تحقيقات در زمينه¬ي پردازش زبان طبيعي است. كيفيت پيكره¬هاي دوزبانه مي¬تواند در نتايج تحقيقات و كارهايي كه از آنها به عنوان منبع استفاده مي¬كنند، تأثير بگذارد. بنابراين بررسي كارايي پيكره¬ها يكي از ملزومات اساسي براي كار با آن¬هاست. هدف از اين پروژه ارزيابي كيفيت پيكره دوزبانه فارسي- انگليسي بدون استفاد از ماشين ترجمه است. با توجه به اين كه يكي از روش¬هاي ارزيابي نرم¬افزارها و منابع نرم¬افزاري، ارزيابي با استفاده از خصوصيات داخلي خود نرم¬افزار يا منبع نرم¬افزاري است؛ در اين پروژه برخي از خصوصيات داخلي پيكره برشمرده شده است. پيچيدگي، تنوع، ترجمه وفادار به متن، فاصله از قانون زيف، فرضيه ماركر و تعداد كاراكترهاي اشتباه خصوصيات بررسي شده براي پيكره هستند. براي هر يك از اين خصوصيت¬ها، الگوريتمي براي كمي¬سازي آن ارائه شده است؛ به عنوان مثال براي بررسي ترجمه وفادار به متن از هم¬ترازي كلمات براي هر يك از جملات هم¬تراز شده در پيكره استفاده شده است كه اين هم¬ترازي از طريق مطابقت با لغت¬نامه بررسي شده است. در نهايت يك سيستم استنتاج فازي براساس خصوصيات تعريف شده ايجاد شده است كه به وسيله آن كيفيت نهايي پيكره به دست مي¬آيد .اين فرآيند براي بخشي از پيكره يك ميليون جمله¬اي انگليسي- فارسي هم¬تراز شده در سطح جمله مورد استفاده قرار گرفت و نتايج آن ارائه گرديده است. براي اين بخش از پيكره كه حدود چهارصد هزار جمله هم¬تراز شده را در بر مي¬گيرد، كيفيت نهايي در حدود 625/72 درصد به دست آمد. واژه‌هاي كليدي: ارزيابي، پيكره‌هاي دوزبانه، پيكره‌هاي هم‌تراز شده، هم¬ترازي كلمه ،ترجمه‌ي ماشيني