شماره ركورد
10336
پديد آورنده
فرناز خوش دوست آزاد
عنوان
تشخيص بات در توييتر
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1404
استاد راهنما
دكتر فرزانه باغباني غيور
استاد مشاور
دكتر مرضيه داوودآبادي
دانشجوي وارد كننده اطلاعات
فرناز خوش دوست ازاد
تاريخ ورود اطلاعات
1405/01/27
دانشكده
مهندسي كامپيوتر
عنوان به انگليسي
Bot Detection in Social Media
چكيده
در سالهاي اخير، افزايش حضور باتها در شبكههاي اجتماعي، شناسايي دقيق و هوشمند آنها را به يك چالش مهم تبديل كرده است. اين پژوهش با هدف تشخيص اكانتهاي بات در توييتر فارسي، رويكردهاي مبتني بر يادگيري ماشين كلاسيك و مدلهاي زباني بزرگ را مورد بررسي و مقايسه قرار داده است. براي اين منظور، يك ديتاست شامل اطلاعات پروفايل و رفتار بيش از 19000 اكانت توييتر جمعآوري و بر اساس نظر پنج كارشناس انساني برچسبگذاري شد.
با استخراج مجموعهاي از ويژگيهاي سطح كاربر و محتواي توييتها، دو مدل EvolveBot مبتني بر الگوريتم Random Forest و مدل زباني بزرگ cf.llama-3.1-8b-instruct-fp8 توسعه يافته و ارزيابي شدند. نتايج آزمايشها نشان داد مدل EvolveBot با بهكارگيري تكنيك SMOTE و تنظيم مناسب آستانه تصميمگيري، توانست با دقت 81٪ و حساسيت 97٪ عملكرد بهتري نسبت به مدل LLM در شناسايي باتها ارائه دهد.
مدل LLM نيز با بهرهگيري از تحليل زباني عميق توانست برخي باتهاي پيچيده را شناسايي كند و خروجيهايي با قابليت تفسير ارائه دهد، هرچند دقت آن نسبت به مدل كلاسيك پايينتر بود.
اين پژوهش نشان ميدهد كه تركيب ويژگيهاي متنوع و استفاده از مدلهاي يادگيري ماشين، همراه با بهرهگيري از مدلهاي زباني بزرگ، ميتواند راهكاري مؤثر براي شناسايي باتها در شبكههاي اجتماعي فارسي باشد. همچنين نتايج اين تحقيق مسيرهاي اميدبخشي براي توسعه مدلهاي تركيبي و چندلايه بهمنظور افزايش دقت و پايداري سيستمهاي تشخيص بات ارائه ميدهد.
كليدواژه ها
تشخيص ربات , شبكه هاي اجتماعي , يادگيري ماشين , تحليل داده