شماره ركورد
34076
پديد آورنده
محمد حسين قفقازيان
عنوان
الگوريتمي براي بهبود استخراج روابط بين موجوديتها از دادههاي متني به كمك روشهاي استدلال چندمرحلهاي و مدلهاي زباني بزرگ
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر
سال تحصيل
1402
تاريخ دفاع
1404/07/27
استاد راهنما
دكتر حسين رحماني
استاد مشاور
دكتر بهروز مينايي
دانشكده
مهندسي كامپيوتر
چكيده
با گسترش روزافزون دادههاي متني در حوزههاي گوناگون، استخراج خودكار روابط معنايي ميان موجوديتها به يكي از چالشهاي اصلي در پردازش زبان طبيعي تبديل شده است. روشهاي سنتي در مواجهه با روابط پيچيده و چندمرحلهاي، كارايي محدودي داشته و درك آنها اغلب با خطا همراه است. در سالهاي اخير، مدلهاي زباني بزرگ پيشرفت چشمگيري در فهم متن و استنتاج مفهومي نشان دادهاند؛ اما استفادة صرف از اين مدلها، بدون بهرهگيري از سازوكارهاي استدلالي، در استخراج روابط دقيق و قابلاعتماد با محدوديتهايي مواجه ميشود.
در اين پژوهش، الگوريتمي تركيبي مبتني بر مدلهاي زباني بزرگ و روشهاي استدلال چندمرحلهاي ارائه شده است كه هدف آن بهبود فرايند استخراج روابط معنايي ميان موجوديتها در متون طبيعي است. روش پيشنهادي بر روي مجموعهدادگان سوالاتپيچيدهوب و پرسشوپاسخ فارسي پيادهسازي شد و نتايج نشان داد كه استفاده از استدلال تدريجي و گامبهگام موجب شناسايي روابط مستقيم و غيرمستقيم با دقت بالاتر ميشود. در مقايسه با روشهاي زنجيره افكار استاندارد، زنجيره افكار خودكار و فاصله خوشهاي وزندار زنجيره افكار، رويكرد ما حداقل 6٪ بهبود در عملكرد كلي را نشان داد. اين نتايج نشان ميدهد كه تركيب مدلهاي زباني بزرگ با سازوكارهاي استدلال چندمرحلهاي ميتواند در استخراج روابط پيچيده و افزايش شفافيت و تفسيرپذيري خروجي مؤثر باشد.
تاريخ ورود اطلاعات
1404/08/27
عنوان به انگليسي
An algorithm for improving relationships between entities from textual data using multi-step reasoning methods and large language models
تاريخ بهره برداري
10/19/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محمدحسين قفقازيان اق زيارت
چكيده به لاتين
With the rapid growth of textual data across various domains, the automatic extraction of semantic relationships among entities has become one of the main challenges in natural language processing. Traditional methods demonstrate limited performance when dealing with complex and multi-step relations, often resulting in inaccurate understanding. In recent years, large language models (LLMs) have shown remarkable progress in text comprehension and conceptual inference; however, relying solely on these models without incorporating reasoning mechanisms faces limitations in producing precise and reliable relation extraction.
In this research, a hybrid algorithm based on large language models and multi-step reasoning techniques is proposed to enhance the process of extracting semantic relations between entities in natural texts. The proposed method was implemented on the Complex Web Questions dataset, and the results indicate that using gradual, step-by-step reasoning enables more accurate identification of both direct and indirect relations. Compared with the standard Chain-of-Thought, Auto-CoT, and Clustered Distance-Weighted CoT methods, our approach achieved an average improvement of about 6% in the comprehensive evaluation score. These findings demonstrate that integrating large language models with multi-step reasoning mechanisms can effectively improve complex relation extraction while enhancing the transparency and interpretability of the model’s outputs.
كليدواژه هاي فارسي
استخراج روابط , پردازش زبان طبيعي , مدلهاي زباني بزرگ , استدلال چندمرحلهاي
كليدواژه هاي لاتين
relation extraction , natural language processing , large language models , multi-step reasoning
Author
Mohammad Hossein Ghafghaziyan
SuperVisor
Hossein Rahmani