شماره ركورد
34727
پديد آورنده
علي فتي
عنوان
ساخت هستانشناسي از دادههاي متني با استفاده از مدلهاي گرافي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيك
سال تحصيل
1402
تاريخ دفاع
1404/11/28
استاد راهنما
دكتر بهروز مينائي بيدگلي
استاد مشاور
دكتر بهروز مينائي بيدگلي
دانشكده
مهندسي كاميپيوتر
چكيده
در سالهاي اخير، افزايش چشمگير دادههاي متني بدون ساختار، ضرورت توسعه روشهاي كارآمد براي استخراج، سازماندهي و بازنمايي دانش را برجسته كرده است. هستانشناسي بهعنوان يكي از اركان اصلي مهندسي دانش، با مدلسازي مفاهيم و روابط معنايي ميان آنها، نقش مهمي در بهبود سيستمهاي پردازش زبان طبيعي ايفا ميكند. با اين حال، استخراج رابطه بهعنوان يكي از مراحل كليدي در ساخت خودكار هستانشناسي، با چالشهايي نظير پيچيدگي معنايي، وابستگي شديد به بافت و محدوديت در كشف دانش جديد، بهويژه در حوزه داروشناسي، مواجه است.
در اين پژوهش، يك چارچوب دو مرحلهاي مبتني بر يادگيري انتقالي، مدلهاي زباني بزرگ و رويكردهاي گرافي براي بهبود استخراج و غنيسازي روابط دارويي ارائه شده است. در مرحله نخست، روش DREaM براي استخراج و دستهبندي روابط ميان موجوديتهاي دارويي از متون علمي پايگاهPubMed بهكار گرفته ميشود. اين روش با انتقال دانش از چارچوب ACORD و بهرهگيري از يادگيري انتقالي، به دقت ميانگين 73٫5٪، فراخواني 72٫2٪ و امتياز F1 برابر با 71٫2٪ دست يافته است كه بيانگر عملكرد پايدارتر و قابلاعتمادتر نسبت به استخراج مستقيم مبتني بر مدلهاي زباني بزرگ در دادههاي تخصصي پزشكي است.
در مرحله دوم، چارچوب PARADOX با هدف غنيسازي گراف آنتولوژي حاصل معرفي ميشود كه در آن، با استفاده از شبكههاي عصبي سيامي، فرآيند تناقضيابي ميان روابط دارويي انجام ميگيرد. در نهايت، از ميان تناقضهاي كانديد استخراجشده از متون PubMed، 39 تناقض دارويي معتبر شناسايي و در قالب يك گراف تناقض بازنمايي شدند كه اين امر موجب افزايش پوشش معنايي و ارتقاي كيفيت گراف دانش دارويي گرديد. بهطور كلي، نتايج نشان ميدهد كه تركيب يادگيري انتقالي، مدلهاي زباني بزرگ و رويكردهاي مبتني بر گراف، ميتواند بهطور مؤثري دقت استخراج رابطه را بهبود داده و به ساخت هستانشناسيهاي غنيتر و تفسيرپذيرتر در حوزه داروشناسي منجر شود.
تاريخ ورود اطلاعات
1405/02/08
عنوان به انگليسي
Ontology Construction from Textual Data using Graph-based Models
تاريخ بهره برداري
4/21/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
علي فتي
چكيده به لاتين
In recent years, the rapid growth of unstructured textual data has highlighted the need for efficient methods to extract, organize, and represent knowledge. Ontology, as a core component of knowledge engineering, plays a crucial role in enhancing natural language processing systems by modeling concepts and their semantic relationships. However, relation extraction, as a key step in automatic ontology construction, faces several challenges, including semantic complexity, strong contextual dependency, and limited capability for discovering novel knowledge—particularly in the domain of pharmacology.
In this thesis, we propose a two-stage framework based on transfer learning, large language models, and graph-based approaches to improve the extraction and enrichment of drug-related relations. In the first stage, the DREaM method is employed to extract and classify relationships among pharmaceutical entities from scientific texts in the PubMed database. By transferring knowledge from the ACORD framework and leveraging transfer learning, this method achieves an average precision of 73.5%, recall of 72.2%, and an F1-score of 71.2%, demonstrating more stable and reliable performance compared to direct extraction using large language models on specialized biomedical data.
In the second stage, the PARADOX framework is introduced to enrich the resulting ontology graph by identifying contradictions among drug-related relations using Siamese neural networks. Ultimately, from the candidate contradictions extracted from PubMed texts, 39 valid drug-related contradictions are identified and represented in the form of a contradiction graph, leading to increased semantic coverage and improved quality of the drug knowledge graph. Overall, the results indicate that integrating transfer learning, large language models, and graph-based approaches can effectively enhance relation extraction accuracy and facilitate the construction of richer and more interpretable ontologies in the pharmacological domain.
كليدواژه هاي فارسي
اﺳﺘﺨﺮاج راﺑﻄه , پردازش زبان طبيعي , يادگيري ماشين , ساخت هستانشناسي , گراف دانش , تناقضيابي
كليدواژه هاي لاتين
Relation Extraction , Natural Language Processing , Machine Learning , Ontology Construction , Knowledge Graph , Contradiction Detection
Author
Ali Fata
SuperVisor
Dr. Behrouz Minaei-Bidgoli