علي فتي

عنوان

ساخت هستان‌شناسي از داده‌هاي متني با استفاده از مدل‌هاي گرافي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي كامپيوتر - هوش مصنوعي و رباتيك

سال تحصيل

1402

تاريخ دفاع

1404/11/28

استاد راهنما

دكتر بهروز مينائي بيدگلي

استاد مشاور

دكتر بهروز مينائي بيدگلي

دانشكده

مهندسي كاميپيوتر

چكيده

در سال‌هاي اخير، افزايش چشمگير داده‌هاي متني بدون ساختار، ضرورت توسعه روش‌هاي كارآمد براي استخراج، سازمان‌دهي و بازنمايي دانش را برجسته كرده است. هستان‌شناسي به‌عنوان يكي از اركان اصلي مهندسي دانش، با مدل‌سازي مفاهيم و روابط معنايي ميان آن‌ها، نقش مهمي در بهبود سيستم‌هاي پردازش زبان طبيعي ايفا مي‌كند. با اين حال، استخراج رابطه به‌عنوان يكي از مراحل كليدي در ساخت خودكار هستان‌شناسي، با چالش‌هايي نظير پيچيدگي معنايي، وابستگي شديد به بافت و محدوديت در كشف دانش جديد، به‌ويژه در حوزه داروشناسي، مواجه است. در اين پژوهش، يك چارچوب دو مرحله‌اي مبتني بر يادگيري انتقالي، مدل‌هاي زباني بزرگ و رويكردهاي گرافي براي بهبود استخراج و غني‌سازي روابط دارويي ارائه شده است. در مرحله نخست، روش DREaM براي استخراج و دسته‌بندي روابط ميان موجوديت‌هاي دارويي از متون علمي پايگاهPubMed به‌كار گرفته مي‌شود. اين روش با انتقال دانش از چارچوب ACORD و بهره‌گيري از يادگيري انتقالي، به دقت ميانگين 73٫5٪، فراخواني 72٫2٪ و امتياز F1 برابر با 71٫2٪ دست يافته است كه بيانگر عملكرد پايدارتر و قابل‌اعتمادتر نسبت به استخراج مستقيم مبتني بر مدل‌هاي زباني بزرگ در داده‌هاي تخصصي پزشكي است. در مرحله دوم، چارچوب PARADOX با هدف غني‌سازي گراف آنتولوژي حاصل معرفي مي‌شود كه در آن، با استفاده از شبكه‌هاي عصبي سيامي، فرآيند تناقض‌يابي ميان روابط دارويي انجام مي‌گيرد. در نهايت، از ميان تناقض‌هاي كانديد استخراج‌شده از متون PubMed، 39 تناقض دارويي معتبر شناسايي و در قالب يك گراف تناقض بازنمايي شدند كه اين امر موجب افزايش پوشش معنايي و ارتقاي كيفيت گراف دانش دارويي گرديد. به‌طور كلي، نتايج نشان مي‌دهد كه تركيب يادگيري انتقالي، مدل‌هاي زباني بزرگ و رويكردهاي مبتني بر گراف، مي‌تواند به‌طور مؤثري دقت استخراج رابطه را بهبود داده و به ساخت هستان‌شناسي‌هاي غني‌تر و تفسيرپذيرتر در حوزه داروشناسي منجر شود.

تاريخ ورود اطلاعات

1405/02/08

عنوان به انگليسي

Ontology Construction from Textual Data using Graph-based Models

تاريخ بهره برداري

4/21/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

علي فتي

Name: علي فتي
Author: علي فتي

چكيده به لاتين

In recent years, the rapid growth of unstructured textual data has highlighted the need for efficient methods to extract, organize, an‎d represent knowledge. Ontology, as a core component of knowledge engineering, plays a crucial role in enhancing natural language processing systems by modeling concepts an‎d their semantic relationships. However, relation extraction, as a key step in automatic ontology construction, faces several challenges, including semantic complexity, strong contextual dependency, an‎d limited capability for discovering novel knowledge—particularly in the domain of pharmacology. In this thesis, we propose a two-stage framework based on transfer learning, large language models, an‎d graph-based approaches to improve the extraction an‎d enrichment of drug-related relations. In the first stage, the DREaM method is employed to extract an‎d classify relationships among pharmaceutical entities from scientific texts in the PubMed database. By transferring knowledge from the ACORD framework an‎d leveraging transfer learning, this method achieves an average precision of 73.5%, recall of 72.2%, an‎d an F1-score of 71.2%, demonstrating more stable an‎d reliable performance compared to direct extraction using large language models on specialized biomedical data. In the second stage, the PARADOX framework is introduced to enrich the resulting ontology graph by identifying contradictions among drug-related relations using Siamese neural networks. Ultimately, from the can‎didate contradictions extracted from PubMed texts, 39 valid drug-related contradictions are identified an‎d represented in the form of a contradiction graph, leading to increased semantic coverage an‎d improved quality of the drug knowledge graph. Overall, the results indicate that integrating transfer learning, large language models, an‎d graph-based approaches can effectively enhance relation extraction accuracy an‎d facilitate the construction of richer an‎d more interpretable ontologies in the pharmacological domain.

كليدواژه هاي فارسي

اﺳﺘﺨﺮاج راﺑﻄه , پردازش زبان طبيعي , يادگيري ماشين , ساخت هستان‌شناسي , گراف دانش , تناقض‌يابي

كليدواژه هاي لاتين

Relation Extraction , Natural Language Processing , Machine Learning , Ontology Construction , Knowledge Graph , Contradiction Detection

Author

Ali Fata

SuperVisor

Dr. Behrouz Minaei-Bidgoli

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34727&Field=0&DTC=6