شماره ركورد
33626
پديد آورنده
ايمان براتي
عنوان
ارائه يك روش پاسخدهي به پرسشهاي پيچيده چندگامي بينزباني مبتني بر مدلهاي زباني بزرگ در سامانه پرسش و پاسخ
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر- هوش مصنوعي و رباتيكز
سال تحصيل
1400
تاريخ دفاع
1403/10/22
استاد راهنما
بهروز مينايي بيدگلي
استاد مشاور
/
دانشكده
دانشكده مهندسي كامپيوتر
چكيده
در سالهاي اخير، پيشرفتهاي چشمگيري در حوزهي پردازش زبان طبيعي و بهويژه در سامانههاي پرسش و پاسخ حاصل شدهاست، اما اين سامانهها غالباً در پاسخدهي به پرسشهاي پيچيدهي چندگامي در محيطهاي چندزبانه، بهويژه براي زبانهاي كممنبع، با محدوديتهايي مواجه هستند. يكي از محدوديتهاي اساسي مدلهاي فعلي، ناتواني در تركيب مؤثر اطلاعات استخراجشده از زبانهاي مختلف است. در اين پژوهش، با معرفي وظيفهاي جديد به نام پرسش و پاسخ چندگامي بينزباني، به بررسي اين چالشها پرداخته شدهاست. براي اين منظور، مجموعهدادهاي مصنوعي به نام XhotpotQA با استفاده از ترجمه مجموعهداده HotpotQA به 23 زبان مختلف ايجاد شدهاست. اين مجموعهداده امكان ارزيابي سامانهها در توانايي ادغام و استنتاج اطلاعات از چندين زبان مختلف را فراهم ميكند. در ادامه براي حل اين وظيفهي پيچيده، روشي مبتني بر مدلهاي زباني بزرگ و معماري دو مرحلهاي انتخابگر-خوانشگر ارائه شدهاست. در اين روش، مسئله به دو زيربخش مجزا شكسته ميشود و هر بخش با استفاده از مدلهاي زباني بزرگ بهطور مستقل پردازش ميشود. همچنين، با بهكارگيري تكنيكهايي مانند زنجيره فكري و تجزيهي پرسش، عملكرد مدلها بهبود يافتهاست. نتايج آزمايشها نشانميدهد كه روش پيشنهادي نهتنها قادر است مسئله پرسش و پاسخ چندگامي در زبان انگليسي را با دقت و كارايي بالا حل كند، بلكه ميتواند بهطور مؤثر بهحالت بينزباني نيز تعميم يابد. اين نتايج بيانگر ظرفيت بالاي مدلهاي زباني بزرگ در حل مسائل پيچيده و چندزبانه است. پژوهش حاضر با ارائه راهكاري نوين، زمينه را براي تحقيقات آينده در حوزه درك و استنتاج چندزبانه فراهم ميسازد.
تاريخ ورود اطلاعات
1404/06/18
عنوان به انگليسي
A Method for Answering Cross-Lingual Complex Question Based on Large Language Models in Question Answering Systems
تاريخ بهره برداري
1/12/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
ايمان براتي
چكيده به لاتين
In recent years, significant advancements have been made in the field of natural language processing, particularly in question-answering systems. However, these systems often face limitations in responding to complex multi-hop questions in multilingual environments, especially for low-resource languages. One of the fundamental limitations of current models is their inability to effectively combine information extracted from different languages. In this research, by introducing a new task called cross-lingual multi-hop question answering, we have addressed these challenges. For this purpose, an artificial dataset named XhotpotQA has been created by translating the HotpotQA dataset into 23 different languages. This dataset enables the evaluation of systems in their ability to integrate and infer information from multiple languages. To solve this complex task, we propose a method based on large language models and a two-stage selector-reader architecture. In this approach, the problem is broken down into two separate sub-tasks, and each part is independently processed using large language models. Additionally, by employing techniques such as chain-of-thought and question decomposition, the performance of the models has been improved. Experimental results show that the proposed method not only can solve the multi-hop question-answering problem in English with high accuracy and efficiency but also can be effectively generalized to the cross-lingual setting. These results indicate the high capacity of large language models in solving complex and multilingual problems. This research, by providing an innovative approach, paves the way for future studies in the field of multilingual understanding and reasoning.
كليدواژه هاي فارسي
سامانه پرسش و پاسخ , پرسش و پاسخ بين زباني , پرسش پيچيده چندگامي , مدلهاي زباني بزرگ , درك زبان طبيعي
كليدواژه هاي لاتين
Question Answering System , Cross-Lingual Question Answering , Complex Multi-Hop Question , Large Language Models , Natural Language Understanding
Author
Eimani
SuperVisor
Dr. Bidgoli