-
شماره ركورد
33029
-
پديد آورنده
علي البخيتاوي
-
عنوان
شناسايي و تشخيص رويدادهاي عربي در شبكههاي اجتماعي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر- نرمافزار
-
سال تحصيل
1401
-
تاريخ دفاع
1403/11/23
-
استاد راهنما
دكتر بهروز مينايي
-
استاد مشاور
استاد مشاور نيست
-
دانشكده
دانشكده مهندسي كامپيوتر
-
چكيده
اين مطالعه بر شناسايي و تحليل رويدادها در شبكههاي اجتماعي عربي به ويژه توييتر تمركز دارد و از روشهاي پيشرفتهاي كه براي پيچيدگيهاي متن عربي طراحي شدهاند استفاده ميكند. با بهرهگيري از يك مجموعه داده شامل بيش از يك ميليون توييت كه از طريق NodeXL Pro جمعآوري شده است اين پژوهش تكنيكهاي پيشپردازش دقيقي را به كار برده تا دادهها استاندارد و تصفيه شوند و مشكلاتي مانند نويز محتواي نامنظم و تنوع زباني را برطرف كند.
سه روش مدلسازي موضوعي تخصيص ديريكله نهفته (LDA)، فاكتورگيري ماتريس غيرمنفي (NMF) و BERTopic براي استخراج موضوعات معنادار ارزيابي شدند كه در اين ميان، NMF عملكرد بهتري نشان داد. علاوه بر اين، شناسايي موجوديتهاي رويدادي با استفاده از ابزارهاي پيشرفته پردازش زبان طبيعي مانند CAMeL-Lab، Stanza و XLM-Roberta انجام شد و موجوديتهايي مانند افراد، اقدامات و مكانها با دقت بالايي شناسايي شدند.
نتايج اين پژوهش با استفاده از مجموعه دادهاي كه به صورت دستي ساخته شده و معيارهايي همچون دقت (Precision) بازخواني (Recall) و امتياز F1 اعتبارسنجي شدند. تكنيكهاي بصريسازي مانند ابرهاي واژگان (Word Clouds) نقشههاي تعاملي و نمودارهاي شبكهاي براي افزايش قابليت تفسير يافتهها به كار گرفته شدند و بينشهايي درباره روابط ميان رويدادها و موجوديتهاي مرتبط ارائه دادند.
اين تحقيق بر اهميت ادغام مدلهاي تحليلي قوي با روشهاي بصريسازي پيشرفته براي درك پوياييهاي رويدادهاي شبكههاي اجتماعي عربي تأكيد دارد. يافتههاي اين مطالعه به طور قابل توجهي به حوزههاي تحليل شبكههاي اجتماعي، مديريت بحران و نظارت بر افكار عمومي كمك كرده و چارچوب روششناسياي را ارائه ميدهد كه ميتوان آن را براي ساير زمينههاي زباني و فرهنگي تطبيق داد.
-
تاريخ ورود اطلاعات
1403/11/29
-
عنوان به انگليسي
Detection and identification of Arab events in Social Networks
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
علي البخيتاوي
-
چكيده به لاتين
This study focuses on detecting and analyzing events within Arabic social networks , particularly Twitter leveraging advanced methodologies tailored for the complexities of Arabic text Utilizing a dataset of over one million tweets collected via NodeXL Pro our study applied rigorous preprocessing techniques to standardize and refine the data , addressing issues like noise unstructured content and linguistic diversity , Three topic modeling methods were used Latent Dirichlet Allocation (LDA) Non negative Matrix Factorization (NMF) and (Bidirectional Encoder Representations from Transformers) BERTopic for their effectiveness in extracting topics, with NMF demonstrating superior performance Additionally event entity detection was performed using state of the art NLP tools such as CAMeL-Lab , Stanza , and XLM-Roberta , identifying entities like people , actions, and places with high precision. The results were validated against a manually constructed dataset using metrics such as Precision , Recall , and F1 Score.
Visualization techniques including Word Clouds interactive maps and network diagrams were employed to enhance the interpretability of findings offering insights into the relationships between events and their associated entities .
This study highlights the importance of integrating robust analytical models with advanced visualization methods to understand the dynamics of Arabic social media events The findings contribute significantly to the fields of social media analysis disaster management, and public opinion monitoring providing a methodological framework that can be adapted for other linguistic and cultural contexts .
-
كليدواژه هاي فارسي
شبكههاي اجتماعي عربي، شناسايي رويداد، مدلسازي موضوعي، LDA، NMF، BERTopic، پردازش زبان طبيعي، CAMeL-Lab، Stanza، XLM-Roberta.
-
كليدواژه هاي لاتين
Arabic social media, event detection, topic modeling, LDA, NMF, BERTopic, NLP, CAMeL-Lab, Stanza ,XLM-Roberta.
-
Author
Ali AL-Bkhaitawi
-
SuperVisor
Dr. Behrouz Minaei
-
لينک به اين مدرک :