شماره ركورد
34154
پديد آورنده
عليرضا
عنوان
تشخيص موضع در دادههاي متني با استفاده از يادگيري گروهي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر
سال تحصيل
1404
تاريخ دفاع
1404/07/06
استاد راهنما
دكتر حسين رحماني
استاد مشاور
-
دانشكده
مهندسي كامپيوتر
چكيده
تشخيص موضع، يكي از مسائل كليدي در پردازش زبان طبيعي، به شناسايي ديدگاه نويسنده نسبت به يك هدف مشخص ميپردازد. اهميت روزافزون اين حوزه در تحليل افكار عمومي و مقابله با اطلاعات نادرست، با چالش تحليل متون كوتاه و مبهم كه فاقد زمينه كافي هستند، روبرو است. اين محدوديت، عملكرد مدلهاي زباني رايج را كه تنها بر اطلاعات سطحي متن تكيه ميكنند، به شدت تضعيف كرده و ضرورت ارائه راهكارهاي نوآورانه را آشكار ميسازد.
اين پاياننامه، يك چارچوب نوآورانه با نام KASnE را معرفي ميكند كه با هدف ارتقاي دقت تشخيص موضع از طريق دو راهكار اصلي طراحي شده است: غنيسازي دانش زمينهاي و يادگيري گروهي. در اين روش، ابتدا با استخراج موجوديتهاي نامدار از متن و بازيابي اطلاعات مرتبط از منابع خارجي مانند ويكيپديا، يك ورودي غنيشده از دانش ايجاد ميگردد. سپس، اين ورودي در اختيار مجموعهاي از مدلهاي زباني بزرگ قرار گرفته و پيشبينيهاي آنها با استفاده از يك ردهبند سطح بالا به روش تعميم پشتهاي تجميع ميشود تا تصميم نهايي اتخاذ گردد.
ارزيابيهاي انجامشده نشان ميدهد كه چارچوب KASnE عملكردي موفق و برتر نسبت به مدلهاي پايه دارد. اين روش بر روي مجموعهداده استاندارد Semeval-2016 توانست به امتياز F1 وزني 76.05% دست يابد كه نتيجهاي كاملاً رقابتي در مقايسه با كارهاي پيشين محسوب ميشود. اين دستاورد به وضوح اثبات ميكند كه تركيب هوشمندانه دانش خارجي با خرد جمعي چندين مدل زباني، يك استراتژي مؤثر براي غلبه بر چالشهاي معنايي در متون كوتاه و افزايش قابل توجه دقت در وظيفه تشخيص موضع است.
تاريخ ورود اطلاعات
1404/09/11
عنوان به انگليسي
Stance detection in textual data using ensemble learning
تاريخ بهره برداري
9/28/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
عليرضا بينش
چكيده به لاتين
Stance detection, one of the key challenges in natural language processing, focuses on identifying an author’s perspective toward a specific target. The growing importance of this field in public opinion analysis and combating misinformation is confronted with the challenge of analyzing short and ambiguous texts that lack sufficient context. This limitation significantly undermines the performance of conventional language models, which mainly rely on surface-level textual information, and highlights the necessity of developing innovative solutions.
This thesis introduces an innovative framework named KASnE, designed to improve stance detection accuracy through two main strategies: knowledge enrichment and ensemble learning. In this approach, named entities are first extracted from the text, and relevant information is retrieved from external resources such as Wikipedia to construct a knowledge-enriched input. This enriched input is then processed by a set of large language models, and their predictions are aggregated using a meta-classifier via stacked generalization to reach the final decision.
The conducted evaluations demonstrate that the KASnE framework achieves superior performance compared to baseline models. On the standard Semeval-2016 dataset, it attained a weighted F1 score of 76.05%, a result that is highly competitive with previous works. This achievement clearly confirms that the intelligent integration of external knowledge with the collective reasoning of multiple language models is an effective strategy for overcoming semantic challenges in short texts and substantially improving stance detection accuracy.
كليدواژه هاي فارسي
تشخيص موضع , پردازش زبان طبيعي , غنيسازي دانش , يادگيري گروهي , تعميم پشتهاي , مدلهاي زباني بزرگ
كليدواژه هاي لاتين
stance detection , natural language processing , knowledge enrichment , ensemble learning , stacked generalization , large language models
Author
Alireza Binesh
SuperVisor
Hossein Rahmani