شماره ركورد
13897
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
13897
پديد آورنده
عاطفه پاكزاد
عنوان
ارائه و بهسازي مدل توأم برچسبزني اجزاي سخن و تجزيهي وابستگي زبان فارسي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
سال تحصيل
آبان ماه 1393
تاريخ دفاع
آبان ماه 1393
استاد راهنما
دكتر بهروز مينايي بيدگلي
چكيده
چكيده
تجزيهي وابستگي راهي براي تجزيهي نحوي زبان طبيعي است كه به صورت خودكار به تجزيه و تحليل ساختار وابستگي جملات پرداخته و براي هر جملهي ورودي يك گراف وابستگي ايجاد ميكند. برچسبزني اجزاي سخن براي انجام تجزيهي وابستگي يك پيشنياز است. عموما تجزيهگرهاي وابستگي به صورت مرحلهاي پيوسته وظايف برچسبزني و تجزيهي وابستگي را به صورت دو گام متوالي انجام ميدهند. در اين مدلها خطاي ناشي از برچسبزني در تجزيهي وابستگي انتشار مييابد، همچنين در حين برچسبزني از اطلاعات مفيد نحوي استفاده نميكند. هدف از ارائهي روشهاي توأم، كاهش همزمان خطاي هر دو وظيفهي برچسبزني اجزاي سخن و تجزيهي وابستگي است. در اين پژوهش براي اولين بار مدل توأم بر روي زبان فارسي با استفاده از نرمافزار Corbit مورد آزمايش قرار گرفته و ويژگيهاي مدل بر روي زبان فارسي بهينهسازي شده كه سبب بهبود در دقت مدل توأم شدهاست. نرمافزار Corbit پيادهسازي يك روش توأم مبتني بر گذار براي وظايف تقسيمبندي كلمه، برچسبزني اجزاي سخن و تجزيهي وابستگي است. در اين پژوهش دقت توأم برچسبزني اجزاي سخن و اتصال بدون برچسب تجزيهي وابستگي براي برچسبهاي درشت بر روي دادهي آزمون برابر 85.59 درصد و براي برچسبهاي ريز 84.24 درصد بهدست آمده است.
واژههاي كليدي: مدل توأم ، اجزاي سخن ، تجزيهي وابستگي ، زبان فارسي