-
شماره ركورد
13897
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
13897
-
پديد آورنده
عاطفه پاكزاد
-
عنوان
ارائه و بهسازي مدل توأم برچسبزني اجزاي سخن و تجزيهي وابستگي زبان فارسي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي و رباتيك
-
سال تحصيل
آبان ماه 1393
-
تاريخ دفاع
آبان ماه 1393
-
استاد راهنما
دكتر بهروز مينايي بيدگلي
-
چكيده
چكيده
تجزيهي وابستگي راهي براي تجزيهي نحوي زبان طبيعي است كه به صورت خودكار به تجزيه و تحليل ساختار وابستگي جملات پرداخته و براي هر جملهي ورودي يك گراف وابستگي ايجاد ميكند. برچسبزني اجزاي سخن براي انجام تجزيهي وابستگي يك پيشنياز است. عموما تجزيهگرهاي وابستگي به صورت مرحلهاي پيوسته وظايف برچسبزني و تجزيهي وابستگي را به صورت دو گام متوالي انجام ميدهند. در اين مدلها خطاي ناشي از برچسبزني در تجزيهي وابستگي انتشار مييابد، همچنين در حين برچسبزني از اطلاعات مفيد نحوي استفاده نميكند. هدف از ارائهي روشهاي توأم، كاهش همزمان خطاي هر دو وظيفهي برچسبزني اجزاي سخن و تجزيهي وابستگي است. در اين پژوهش براي اولين بار مدل توأم بر روي زبان فارسي با استفاده از نرمافزار Corbit مورد آزمايش قرار گرفته و ويژگيهاي مدل بر روي زبان فارسي بهينهسازي شده كه سبب بهبود در دقت مدل توأم شدهاست. نرمافزار Corbit پيادهسازي يك روش توأم مبتني بر گذار براي وظايف تقسيمبندي كلمه، برچسبزني اجزاي سخن و تجزيهي وابستگي است. در اين پژوهش دقت توأم برچسبزني اجزاي سخن و اتصال بدون برچسب تجزيهي وابستگي براي برچسبهاي درشت بر روي دادهي آزمون برابر 85.59 درصد و براي برچسبهاي ريز 84.24 درصد بهدست آمده است.
واژههاي كليدي: مدل توأم ، اجزاي سخن ، تجزيهي وابستگي ، زبان فارسي
-
لينک به اين مدرک :