شماره ركورد
9815
پديد آورنده
الهام غلامي متكي - سيد ماكان حاجي سيد جوادي
عنوان
به كارگيري مدل هاي زباني پيش آموزش ديده براي طبقه بندي توييت هاي مرتبط با بحران ها
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1404
استاد راهنما
خانم دكتر فرزانه غيور باغباني
دانشجوي وارد كننده اطلاعات
سيد ماكان حاجي سيد جوادي
تاريخ ورود اطلاعات
1404/07/12
دانشكده
مهندسي كامپيوتر
عنوان به انگليسي
Utilizing Pre-trained Language Models for Classifying Crisis-Related Tweets
چكيده
اين پژوهش روشي براي برآورد شدت افسردگي و پيشبيني خطر بحران از متنهاي توييتر ارائه ميدهد و آن را با چارچوب باليني PHQ-9 همسو ميكند. ابتدا توييتها پاكسازي و به خلاصههاي هفتگي تبديل ميشوند. سپس با پرامپتنويسي بر پايهي 9 نشانهي PHQ-9 و با كمك يك LLM، به هر هفته نمره داده ميشود. متن هر هفته به بردار عددي تبديل و همراه با ويژگيهاي زماني مانند مقدار فعاليت شبانه و نظم هفتگي به يك مدل دنبالهاي GRU داده ميشود تا شدت و احتمال بحران را همزمان پيشبيني كند. ارزيابي با منحنيهاي ROC و PR، ماتريس آشفتگي و كاليبراسيون نشان ميدهد مدل از حد تصادفي بهتر است، هرچند پيشبيني زودهنگام بحران محدود و دقت احتمالات نيازمند بهبود است. محدوديتهاي اصلي شامل دسترسي محدود به API، كاهش اجباري كاربران و هفتهها به دليل منابع محاسباتي، و خطاي احتمالي در برچسبگذاري خودكار است. در كارهاي آتي، بهرهگيري از ترنسفومرها، دادههاي چندمنبعي و روشهاي برچسبگذاري few-shot ميتواند كارايي و تعميمپذيري را افزايش دهد.
كليدواژه ها
افسردگي , توييتر , PHQ-9 , GRU , برچسبگذاري با LLM