عليرضا

عنوان

تشخيص موضع در داده‌هاي متني با استفاده از يادگيري‌ گروهي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي كامپيوتر

سال تحصيل

1404

تاريخ دفاع

1404/07/06

استاد راهنما

دكتر حسين رحماني

استاد مشاور

دانشكده

مهندسي كامپيوتر

چكيده

تشخيص موضع، يكي از مسائل كليدي در پردازش زبان طبيعي، به شناسايي ديدگاه نويسنده نسبت به يك هدف مشخص مي‌پردازد. اهميت روزافزون اين حوزه در تحليل افكار عمومي و مقابله با اطلاعات نادرست، با چالش تحليل متون كوتاه و مبهم كه فاقد زمينه كافي هستند، روبرو است. اين محدوديت، عملكرد مدل‌هاي زباني رايج را كه تنها بر اطلاعات سطحي متن تكيه مي‌كنند، به شدت تضعيف كرده و ضرورت ارائه راهكارهاي نوآورانه را آشكار مي‌سازد. اين پايان‌نامه، يك چارچوب نوآورانه با نام KASnE را معرفي مي‌كند كه با هدف ارتقاي دقت تشخيص موضع از طريق دو راهكار اصلي طراحي شده است: غني‌سازي دانش زمينه‌اي و يادگيري گروهي. در اين روش، ابتدا با استخراج موجوديت‌هاي نامدار از متن و بازيابي اطلاعات مرتبط از منابع خارجي مانند ويكي‌پديا، يك ورودي غني‌شده از دانش ايجاد مي‌گردد. سپس، اين ورودي در اختيار مجموعه‌اي از مدل‌هاي زباني بزرگ قرار گرفته و پيش‌بيني‌هاي آن‌ها با استفاده از يك رده‌بند سطح بالا به روش تعميم پشته‌اي تجميع مي‌شود تا تصميم نهايي اتخاذ گردد. ارزيابي‌هاي انجام‌شده نشان مي‌دهد كه چارچوب KASnE عملكردي موفق و برتر نسبت به مدل‌هاي پايه دارد. اين روش بر روي مجموعه‌داده استاندارد Semeva‎l-2016 توانست به امتياز F1 وزني 76.05% دست يابد كه نتيجه‌اي كاملاً رقابتي در مقايسه با كارهاي پيشين محسوب مي‌شود. اين دستاورد به وضوح اثبات مي‌كند كه تركيب هوشمندانه دانش خارجي با خرد جمعي چندين مدل زباني، يك استراتژي مؤثر براي غلبه بر چالش‌هاي معنايي در متون كوتاه و افزايش قابل توجه دقت در وظيفه تشخيص موضع است.

تاريخ ورود اطلاعات

1404/09/11

عنوان به انگليسي

Stance detection in textual data using ensemble learning

تاريخ بهره برداري

9/28/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

عليرضا بينش

Name: عليرضا بينش
Author: عليرضا

چكيده به لاتين

Stance detection, one of the key challenges in natural language processing, focuses on identifying an author’s perspective toward a specific target. The growing importance of this field in public opinion analysis an‎d combating misinformation is confronted with the challenge of analyzing short an‎d ambiguous texts that lack sufficient context. This limitation significantly undermines the performance of conventional language models, which mainly rely on surface-level textual information, an‎d highlights the necessity of developing innovative solutions. This thesis introduces an innovative framework named KASnE, designed to improve stance detection accuracy through two main strategies: knowledge enrichment an‎d ensemble learning. In this approach, named entities are first extracted from the text, an‎d relevant information is retrieved from external resources such as Wikipedia to construct a knowledge-enriched input. This enriched input is then processed by a set of large language models, an‎d their predictions are aggregated using a meta-classifier via stacked generalization to reach the final decision. The conducted eva‎luations demonstrate that the KASnE framework achieves superior performance compared to baseline models. On the stan‎dard Semeva‎l-2016 dataset, it attained a weighted F1 score of 76.05%, a result that is highly competitive with previous works. This achievement clearly confirms that the intelligent integration of external knowledge with the collective reasoning of multiple language models is an effective strategy for overcoming semantic challenges in short texts an‎d substantially improving stance detection accuracy.

كليدواژه هاي فارسي

تشخيص موضع , پردازش زبان طبيعي , غني‌سازي دانش , يادگيري گروهي , تعميم پشته‌اي , مدل‌هاي زباني بزرگ

كليدواژه هاي لاتين

stance detection , natural language processing , knowledge enrichment , ensemble learning , stacked generalization , large language models

Author

Alireza Binesh

SuperVisor

Hossein Rahmani

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34154&Field=0&DTC=6