• شماره ركورد
    9815
  • پديد آورنده

    الهام غلامي متكي - سيد ماكان حاجي سيد جوادي

  • عنوان
    به كارگيري مدل هاي زباني پيش آموزش ديده براي طبقه بندي توييت هاي مرتبط با بحران ها
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي كامپيوتر
  • سال فارغ التحصيلي
    1404
  • استاد راهنما
    خانم دكتر فرزانه غيور باغباني
  • دانشجوي وارد كننده اطلاعات

    سيد ماكان حاجي سيد جوادي

  • تاريخ ورود اطلاعات
    1404/07/12
  • دانشكده
    مهندسي كامپيوتر
  • عنوان به انگليسي
    Utilizing Pre-trained Language Models for Classifying Crisis-Related Tweets
  • چكيده
    اين پژوهش روشي براي برآورد شدت افسردگي و پيش‌بيني خطر بحران از متن‌هاي توييتر ارائه مي‌دهد و آن را با چارچوب باليني PHQ-9 هم‌سو مي‌كند. ابتدا توييت‌ها پاك‌سازي و به خلاصه‌هاي هفتگي تبديل مي‌شوند. سپس با پرامپت‌نويسي بر پايه‌ي 9 نشانه‌ي PHQ-9 و با كمك يك LLM، به هر هفته نمره داده مي‌شود. متن هر هفته به بردار عددي تبديل و همراه با ويژگي‌هاي زماني مانند مقدار فعاليت شبانه و نظم هفتگي به يك مدل دنباله‌اي GRU داده مي‌شود تا شدت و احتمال بحران را هم‌زمان پيش‌بيني كند. ارزيابي با منحني‌هاي ROC و PR، ماتريس آشفتگي و كاليبراسيون نشان مي‌دهد مدل از حد تصادفي بهتر است، هرچند پيش‌بيني زودهنگام بحران محدود و دقت احتمالات نيازمند بهبود است. محدوديت‌هاي اصلي شامل دسترسي محدود به API، كاهش اجباري كاربران و هفته‌ها به دليل منابع محاسباتي، و خطاي احتمالي در برچسب‌گذاري خودكار است. در كارهاي آتي، بهره‌گيري از ترنسفومرها، داده‌هاي چندمنبعي و روش‌هاي برچسب‌گذاري few-shot مي‌تواند كارايي و تعميم‌پذيري را افزايش دهد.
  • كليدواژه ها
    افسردگي , توييتر , PHQ-9 , GRU , برچسب‌گذاري با LLM