-
شماره ركورد
11072
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
11072
-
پديد آورنده
مجتبي خلاش
-
عنوان
ساز و كاري براي كشف تأثير ويژگي هاي مختلف ساخت واژي و صرفي بر روي تجزية وابستگي زبان فارسي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
-
سال تحصيل
آبان ماه 1391
-
تاريخ دفاع
آبان ماه 1391
-
استاد راهنما
دكتر بهروز مينايي بيدگلي
-
چكيده
چكيده
سامانههاي مبتني بر داده به راحتي ميتوانند به ساير زبانها يا دامنهها منتقل شود. به همين دليل در تجزية وابستگي نيز اقبال به روشهاي «مبتني بر داده» بيش از روشهاي «مبتني بر دستور» بوده است. تنها پيشنياز اين روشها وجود پيكرة وابستگي شامل جملات و درخت وابستگي متناظر با آن است كه تهية آن امري پرهزينه و زمانبر است. با اين وجود تاكنون براي حدود 30 زبان پيكرة وابستگي تهيه شده كه زبان فارسي نيز جزو اين دسته از زبانهاست.
با وجود صحت بالاي تجزية وابستگي در زبان انگليسي، اعمال الگوريتمهاي موجود بر روي دستهاي از زبانها اغلب منجر به افت صحت ميشود كه دليل اين امر را ميتوان در پررنگتر بودن عامل بيترتيبي و غني بودن ساختواژهها در زبان مقصد نسبت به زبان انگليسي دانست. اين بدان معناست كه سامانههاي مبتني بر داده نيازمند انتخاب خصوصيات و تنظيم دقيق پارامترها به منظور رسيدن به كارايي بهينه هستند. اين امر كار پيچيدهاي است كه نيازمند دانش خاص از سامانه و خواص زبان مقصد است.
در اين پاياننامه ابتدا مروري بر تلاشهاي انجامشده براي برخورد با اين مسئله در ساير زبانها خواهيم پرداخت و پس از ترسيم روند كاري، سعي شده تا اين روند بر روي زبان فارسي انجام و عوامل تأثيرگذار بر كاهش صحت تجزيه شناسايي شوند. سپس مجموعهاي از 10 خصوصيت ساختواژي و مفهومي مورد بررسي قرار گرفته و ضمن بررسي تأثير هر خصوصيت به صورت جداگانه، بهترين تركيب اين خصوصيات ارائه شده است.
واژههاي كليدي: تجزية وابستگي، خصوصيات ساختواژي و صرفي، پيكرة وابستگي.
-
لينک به اين مدرک :