شماره ركورد
11072
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
11072
پديد آورنده
مجتبي خلاش
عنوان
ساز و كاري براي كشف تأثير ويژگي هاي مختلف ساخت واژي و صرفي بر روي تجزية وابستگي زبان فارسي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
سال تحصيل
آبان ماه 1391
تاريخ دفاع
آبان ماه 1391
استاد راهنما
دكتر بهروز مينايي بيدگلي
چكيده
چكيده
سامانههاي مبتني بر داده به راحتي ميتوانند به ساير زبانها يا دامنهها منتقل شود. به همين دليل در تجزية وابستگي نيز اقبال به روشهاي «مبتني بر داده» بيش از روشهاي «مبتني بر دستور» بوده است. تنها پيشنياز اين روشها وجود پيكرة وابستگي شامل جملات و درخت وابستگي متناظر با آن است كه تهية آن امري پرهزينه و زمانبر است. با اين وجود تاكنون براي حدود 30 زبان پيكرة وابستگي تهيه شده كه زبان فارسي نيز جزو اين دسته از زبانهاست.
با وجود صحت بالاي تجزية وابستگي در زبان انگليسي، اعمال الگوريتمهاي موجود بر روي دستهاي از زبانها اغلب منجر به افت صحت ميشود كه دليل اين امر را ميتوان در پررنگتر بودن عامل بيترتيبي و غني بودن ساختواژهها در زبان مقصد نسبت به زبان انگليسي دانست. اين بدان معناست كه سامانههاي مبتني بر داده نيازمند انتخاب خصوصيات و تنظيم دقيق پارامترها به منظور رسيدن به كارايي بهينه هستند. اين امر كار پيچيدهاي است كه نيازمند دانش خاص از سامانه و خواص زبان مقصد است.
در اين پاياننامه ابتدا مروري بر تلاشهاي انجامشده براي برخورد با اين مسئله در ساير زبانها خواهيم پرداخت و پس از ترسيم روند كاري، سعي شده تا اين روند بر روي زبان فارسي انجام و عوامل تأثيرگذار بر كاهش صحت تجزيه شناسايي شوند. سپس مجموعهاي از 10 خصوصيت ساختواژي و مفهومي مورد بررسي قرار گرفته و ضمن بررسي تأثير هر خصوصيت به صورت جداگانه، بهترين تركيب اين خصوصيات ارائه شده است.
واژههاي كليدي: تجزية وابستگي، خصوصيات ساختواژي و صرفي، پيكرة وابستگي.