-
شماره ركورد
9387
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
9387
-
پديد آورنده
معصومه مشايخي
-
عنوان
معرفي معيار¬هايي براي ارزيابي پيكره موازي فارسي انگليسي هم¬تراز شده در سطح جمله
-
مقطع تحصيلي
درجه كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر گرايش هوش مصنوعي و رباتيك
-
سال تحصيل
بهمن ماه 1390
-
تاريخ دفاع
بهمن ماه 1390
-
استاد راهنما
دكتر مرتضي آنالويي ، دكتر بهروز مينايي
-
چكيده
چكيده
پيكره¬هاي دوزبانه يكي از منابع مهم براي كارها و تحقيقات در زمينه¬ي پردازش زبان طبيعي است. كيفيت پيكره¬هاي دوزبانه مي¬تواند در نتايج تحقيقات و كارهايي كه از آنها به عنوان منبع استفاده مي¬كنند، تأثير بگذارد. بنابراين بررسي كارايي پيكره¬ها يكي از ملزومات اساسي براي كار با آن¬هاست. هدف از اين پروژه ارزيابي كيفيت پيكره دوزبانه فارسي- انگليسي بدون استفاد از ماشين ترجمه است. با توجه به اين كه يكي از روش¬هاي ارزيابي نرم¬افزارها و منابع نرم¬افزاري، ارزيابي با استفاده از خصوصيات داخلي خود نرم¬افزار يا منبع نرم¬افزاري است؛ در اين پروژه برخي از خصوصيات داخلي پيكره برشمرده شده است. پيچيدگي، تنوع، ترجمه وفادار به متن، فاصله از قانون زيف، فرضيه ماركر و تعداد كاراكترهاي اشتباه خصوصيات بررسي شده براي پيكره هستند. براي هر يك از اين خصوصيت¬ها، الگوريتمي براي كمي¬سازي آن ارائه شده است؛ به عنوان مثال براي بررسي ترجمه وفادار به متن از هم¬ترازي كلمات براي هر يك از جملات هم¬تراز شده در پيكره استفاده شده است كه اين هم¬ترازي از طريق مطابقت با لغت¬نامه بررسي شده است. در نهايت يك سيستم استنتاج فازي براساس خصوصيات تعريف شده ايجاد شده است كه به وسيله آن كيفيت نهايي پيكره به دست مي¬آيد .اين فرآيند براي بخشي از پيكره يك ميليون جمله¬اي انگليسي- فارسي هم¬تراز شده در سطح جمله مورد استفاده قرار گرفت و نتايج آن ارائه گرديده است. براي اين بخش از پيكره كه حدود چهارصد هزار جمله هم¬تراز شده را در بر مي¬گيرد، كيفيت نهايي در حدود 625/72 درصد به دست آمد.
واژههاي كليدي: ارزيابي، پيكرههاي دوزبانه، پيكرههاي همتراز شده، هم¬ترازي كلمه ،ترجمهي ماشيني
-
لينک به اين مدرک :