شماره ركورد
10036
پديد آورنده
مرتضي ملكي نژاد شوشتري
عنوان
ترجمه متن به پيكتوگرام با استفاده از مدل هاي زباني
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1404
استاد راهنما
صالح اعتمادي
دانشجوي وارد كننده اطلاعات
مرتضي ملكي نژادشوشتري
تاريخ ورود اطلاعات
1404/08/11
دانشكده
مهندسي كامپيوتر
عنوان به انگليسي
Translating text to pictograms using language models
چكيده
پيكتوگرامها، تصاوير نماديني هستند كه مفهوم يا كلمهاي را منتقل ميكنند. با يك توالي از پيكتوگرامها ميتوان جملهاي ساخت كه هر فردي با هر زباني بتواند معناي آن را بفهمد. با پيكتوگرامها ميتوان با افرادي كه در ارتباط از طريق زبان دشواري دارند ارتباط گرفت و به جاي استفاده از زبان طبيعي از يك توالي از پيكتوگرامها استفاده شود.
ترجمهي متن به پيكتوگرام كاري دشوار و پيچيده است. دليل اصلي اين دشواري تفاوت ميان زبان نوشتاري و بيان تصويري است. براي انتقال درست معنا، مجموعهي پيكتوگرامها بايد بسيار متنوع و گسترده باشند تا بتواند مفاهيم مختلف را نمايش دهد. به همين دليل، انجام ترجمه بهصورت دستي كار سادهاي نيست و نياز به دقت و زمان زيادي دارد. در بسياري از موارد، براي بيان يك واژه يا مفهوم بايد از چند پيكتوگرام بهصورت تركيبي استفاده كرد. همچنين گاهي چند واژه يا حتي يك جملهي كوتاه را ميتوان تنها با يك پيكتوگرام نشان داد. اين ناهماهنگي ميان زبان و تصوير، فرايند ترجمه را پيچيدهتر ميكند و نياز به درك دقيقتر معنا و ارتباط واژهها را افزايش ميدهد. به همين دليل، يك سامانه كارآمد براي ترجمهي خودكار متن به پيكتوگرام ميتواند هم سرعت بيشتري داشته باشد و هم با دقت بيشتري كار ترجمه را انجام دهد.
در اين پژوهش، ابتدا مطالعات پيشين در حوزهٔ ترجمهٔ متن به پيكتوگرام بررسي شده و شيوهٔ انجام، نتايج و چالشهاي هر يك تحليل گرديده است.
سپس با بهرهگيري از روشهاي بردارسازي واژه، يك مدل پايه پيادهسازي و ارزيابي شده است.
در گام بعد، مدلهاي زباني از پيشآموزشديده با استفاده از روش ريزتنظيم آموزش داده شدهاند و نتايج آنها با نتايج روشهاي سنتي مقايسه شده است.
همچنين رويكرد توليد تقويتشده با بازيابي مورد بررسي قرار گرفته كه نتايج آن چندان رضايتبخش نبوده است.
در نهايت، سامانهاي طراحي شده كه متن ورودي را به مجموعهاي از پيكتوگرامهاي متناظر تبديل كرده و آنها را بهصورت بصري نمايش ميدهد.
كليدواژه ها
ترجمه متن به پيكتوگرام , بازيابي تركيب شده با توليد , ارتباط جايگزين و افزوده , بردار معنايي واژه ها , ريزتنظيم , شباهت معنايي