شماره ركورد
16869
عنوان
مطالعهاي بر روي تكنيكهاي تشخيص نفرتپراكني با استفاده از پردازش زبان طبيعي
سال تحصيل
1402
استاد راهنما
حسن نادري
چکيده
نفرتپراكني در رسانههاي اجتماعي و ساير ارتباطات ديجيتال به دليل انفجار فناوري مورد استفاده براي ارائه آن، به سرعت رشد كرده است. اين امر بُعد جديدي از تأثير بر جامعه، از نظر ذهني، قانوني و اجتماعي ايجاد كرده است. اين رويدادها نياز به تشخيص خودكار نفرتپراكني را افزايش داده است كه يك چالش بزرگ در پردازش زبان طبيعي (NLP) و هوش مصنوعي (AI) است. تشخيص خودكار نفرتپراكني به دلايل زيادي، از جمله ابهام زباني، وابستگي نفرتپراكني به متن، استفاده از زبان مجازي/ضمني، تفاوتهاي فرهنگي بين زبانها، استفاده از تغيير كد و ماهيت شخصي فرآيندهاي حاشيهنويسي، دشوار است. بنابراين، ابزارهايي كه توسط محققان براي تشخيص نفرتپراكني توسعه يافتهاند، اغلب قادر به تعميم خوب نيستند و بر اساس دادههاي آموزشي خود، جانبدارانه عمل ميكنند. در اين سمينار، ما يك ارائه جامع و ساختاريافته در مورد روشهاي تشخيص نفرتپراكني با استفاده از NLP ارائه خواهيم داد. ما با مروري بر چگونگي توسعه يادگيري ماشين سنتي، روشهاي مبتني بر ويژگي، معماريهاي يادگيري عميق، مدلهاي مبتني بر ترانسفورماتور و مدلهاي زباني بزرگ در طول زمان شروع خواهيم كرد. ما توجه ويژهاي به محيطهاي چندزبانه خواهيم داشت، جايي كه دادههاي حاشيهنويسيشدهي كمي براي آموزش در دسترس است يا اصلاً وجود ندارد و تنوع زياد در زبان، چالشهاي بيشتري را براي تشخيص دقيق سخنان نفرتپراكن ايجاد ميكند. جديدترين پيشرفتها در تكنيكهاي تشخيص سخنان نفرتپراكن قابل توضيح/تفسير نيز گنجانده شده است، زيرا اين پيشرفتها براي توسعه سيستمهاي هوش مصنوعي انسانمحورتر كه در حوزههاي كاربردي حساس استفاده خواهند شد، اهميت دارند. با بررسي ادبيات، برخي از چالشهاي موجود در ادبيات تحقيقاتي فعلي در مورد تشخيص سخنان نفرتپراكن را روشن خواهيم كرد، كه شامل موارد زير است: 1) عدم تجزيه و تحليل عبارات ضمني سخنان نفرتپراكن، 2) عدم تفسيرپذيري، 3) اندازه نمونه و سوگيري بازنمايي در مجموعه دادههاي مورد استفاده براي آموزش، و 4) عدم وجود روشهاي ارزيابي سازگار و قابل اعتماد (ما نمونههايي از اين مشكلات را ارائه خواهيم داد). ما يك روش جديد براي تشخيص سخنان نفرتپراكن با استفاده از يادگيري بازنمايي قوي، يادگيري انتقالي بين زباني و مكانيسمهاي قابليت توضيح براي بهبود دقت تشخيص، همراه با شفافيت/انصاف در تشخيص سخنان نفرتپراكن پيشنهاد خواهيم كرد. در نهايت، فهرستي از فرصتهاي تحقيقاتي آينده براي بهبود و ايجاد سيستمهاي تشخيص گفتار نفرتپراكن قابل اعتماد، اخلاقي و مقياسپذير كه براي محيطهاي دنياي واقعي و همه تفاوتهاي فرهنگي/زباني مناسب باشند، ارائه خواهيم داد.
نام دانشجو
انوار الدليمي
تاريخ ارائه
2/18/2026 12:00:00 AM
متن كامل
89744
پديد آورنده
انوار الدليمي
تاريخ ورود اطلاعات
1404/11/29
عنوان به انگليسي
A Study on Hate Speech Detection Techniques Using Natural Language Processing
كليدواژه هاي فارسي
پردازش زبان طبيعي , مدلهاي زبان عربي , طبقهبندي متن , 95 تشخيص گفتار نفرتپراكن
كليدواژه هاي لاتين
Natural Language Processing , Text Classification , Arabic Language , Hate Speech Detection