محمد حسين قفقازيان

عنوان

الگوريتمي براي بهبود استخراج روابط بين موجوديت‌ها از داده‌هاي متني به كمك روش‌هاي استدلال چندمرحله‌اي و مدل‌هاي زباني بزرگ

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي كامپيوتر

سال تحصيل

1402

تاريخ دفاع

1404/07/27

استاد راهنما

دكتر حسين رحماني

استاد مشاور

دكتر بهروز مينايي

دانشكده

مهندسي كامپيوتر

چكيده

با گسترش روزافزون داده‌هاي متني در حوزه‌هاي گوناگون، استخراج خودكار روابط معنايي ميان موجوديت‌ها به يكي از چالش‌هاي اصلي در پردازش زبان طبيعي تبديل شده است. روش‌هاي سنتي در مواجهه با روابط پيچيده و چندمرحله‌اي، كارايي محدودي داشته و درك آن‌ها اغلب با خطا همراه است. در سال‌هاي اخير، مدل‌هاي زباني بزرگ پيشرفت چشمگيري در فهم متن و استنتاج مفهومي نشان داده‌اند؛ اما استفادة صرف از اين مدل‌ها، بدون بهره‌گيري از سازوكارهاي استدلالي، در استخراج روابط دقيق و قابل‌اعتماد با محدوديت‌هايي مواجه مي‌شود. در اين پژوهش، الگوريتمي تركيبي مبتني بر مدل‌هاي زباني بزرگ و روش‌هاي استدلال چندمرحله‌اي ارائه شده است كه هدف آن بهبود فرايند استخراج روابط معنايي ميان موجوديت‌ها در متون طبيعي است. روش پيشنهادي بر روي مجموعه‌دادگان سوالات‌پيچيده‌وب و پرسش‌وپاسخ فارسي پياده‌سازي شد و نتايج نشان داد كه استفاده از استدلال تدريجي و گام‌به‌گام موجب شناسايي روابط مستقيم و غيرمستقيم با دقت بالاتر مي‌شود. در مقايسه با روش‌هاي زنجيره افكار استاندارد، زنجيره افكار خودكار و فاصله خوشه‌اي وزن‌دار زنجيره افكار، رويكرد ما حداقل 6٪ بهبود در عملكرد كلي را نشان داد. اين نتايج نشان مي‌دهد كه تركيب مدل‌هاي زباني بزرگ با سازوكارهاي استدلال چندمرحله‌اي مي‌تواند در استخراج روابط پيچيده و افزايش شفافيت و تفسيرپذيري خروجي مؤثر باشد.

تاريخ ورود اطلاعات

1404/08/27

عنوان به انگليسي

An algorithm for improving relationships between entities from textual data using multi-step reasoning methods an‎d large language models

تاريخ بهره برداري

10/19/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

محمدحسين قفقازيان اق زيارت

Name: محمدحسين قفقازيان اق زيارت
Author: محمد حسين قفقازيان

چكيده به لاتين

With the rapid growth of textual data across various domains, the automatic extraction of semantic relationships among entities has become one of the main challenges in natural language processing. Traditional methods demonstrate limited performance when dealing with complex an‎d multi-step relations, often resulting in inaccurate understan‎ding. In recent years, large language models (LLMs) have shown remarkable progress in text comprehension an‎d conceptual inference; however, relying solely on these models without incorporating reasoning mechanisms faces limitations in producing precise an‎d reliable relation extraction. In this research, a hybrid algorithm based on large language models an‎d multi-step reasoning techniques is proposed to enhance the process of extracting semantic relations between entities in natural texts. The proposed method was implemented on the Complex Web Questions dataset, an‎d the results indicate that using gradual, step-by-step reasoning enables more accurate identification of both direct an‎d indirect relations. Compared with the stan‎dard Chain-of-Thought, Auto-CoT, an‎d Clustered Distance-Weighted CoT methods, our approach achieved an average improvement of about 6% in the comprehensive eva‎luation score. These findings demonstrate that integrating large language models with multi-step reasoning mechanisms can effectively improve complex relation extraction while enhancing the transparency an‎d interpretability of the model’s outputs.

كليدواژه هاي فارسي

استخراج روابط , پردازش زبان‌ طبيعي , مدل‌هاي زباني بزرگ , استدلال چندمرحله‌اي

كليدواژه هاي لاتين

relation extraction , natural language processing , large language models , multi-step reasoning

Author

Mohammad Hossein Ghafghaziyan

SuperVisor

Hossein Rahmani

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34076&Field=0&DTC=6