شماره ركورد
28128
پديد آورنده
رضا محمدي
عنوان
شناسايي موضوعات داغ در توييتر با تاكيد بر تحليل ساختاري
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
سال تحصيل
1399
تاريخ دفاع
1401/12/21
استاد راهنما
دكتر حسن نادري
دانشكده
مهندسي كامپيوتر
چكيده
همواره يافتن موضوعات داغ در شبكه هاي اجتماعي از موضوعات مورد توجه در بين جوامع علمي بوده است. از آنجاييكه توييتر به عنوان يكي از مهمترين و گسترده ترين شبكه هاي اجتماعي از حيث تعداد كاربران مي باشد، لذا تحقيقات عمده اي را در اين حوزه به خود اختصاص داده است. با توجه به اينكه موضوعات داغ، برآمده از محتواي پيامهاي رد و بدل شده بين كاربران مي باشد، طبيعي است كه عمده مطالعات، بر اساس تحليل هاي محتوايي باشد. در اين تحليل ها از روش هايي كه مبتني بر شمارش كلمات، وزن اهميت آنها، تحليل نحوي متن پيام به قصد شناسايي و استخراج مفاهيم و موضوعات آشكار و پنهان موجود در آن، استفاده از روشهاي بردارسازي به قصد محاسبه مشابهت بين مفهوم پيامها و در نهايت استفاده از تكنيك هاي داده كاوي مي باشد، به يافتن موضوعات داغ پرداخته شده است. ضمنا روش هاي تحليل و كشف احساسات از پيام ها نيز از روشهاي مطالعه شده در اين حوزه مي باشد. محدوديت هاي موجود در توييتر از جمله محدوديت تعداد كاراكترهاي پيام، استفاده از گفتمان هاي غير متداول محاوره اي و اختصاري، به كاربردن شكلكها ، تغيير ادبيات گفتماني در طول زمان و نيز وابستگي تكنيك هاي فوق به زبان، از چالش هاي عمده مطالعات مبتني بر تحليل محتوايي مي باشند. در راستاي گريز از اين چالشها و يافتن موضوعات داغ، فارغ از زبان به كار رفته در پيام، ما بر وجهي ديگر از تحليل شبكه اجتماعي تمركز كرديم و آن، استخراج ويژگي هايي است كه در هنگام رخداد وقايع و موضوعات داغ مي توانند واكنش مناسبي جهت تشخيص از خود بروز دهند. به اين منظور با بررسي ويژگي هاي فراداده اي پيام، كاربر مرتبط و ساختار شبكه وي و نيز بهره گيري از مطالعاتي كه به بررسي نقش فراداده ها در خصوص ميزان محبوبيت توييت انجام داده اند، اقدام به تعريف ويژگي هاي قابل اندازه گيري و تابعي موسوم به تابع پتانسيل كرديم كه نشاندهنده شاخص بالقوه ترند شدن يك توييت مي باشد. سپس با كمك اين تابع توانستيم موضوعات داغ را در مراحل ابتدايي وقوع آن شناسايي كرده و اعلام كنيم. با مقايسه نتايج حاصل از اين روش با روش هاي گذشته به اين نتيجه رسيديم كه تحليل فراداده اي توييت ها، فارغ از بررسي محتواي متن پيام، نتايج مشابهي از جهت كشف ترندهاي درحال وقوع با روشهاي مبتني بر تحليل محتوايي در پي خواهد داشت.
واژههاي كليدي: تشخيص موضوع داغ، تحليل مبتني برساختار، شناسايي ناهنجاري،تابع پتانسل ترند
تاريخ ورود اطلاعات
1402/01/28
عنوان به انگليسي
Trend Detection in Twitter with emphasis on Structural Analysis
تاريخ بهره برداري
3/11/2024 12:00:00 AM
دانشجوي وارد كننده اطلاعات
رضا محمدي
چكيده به لاتين
Finding trends in social networks has always been one of the most interested topics among scientific communities. Since Twitter is one of the most important and widespread social networks in terms of the number of users, it has devoted a lot of research in this field. Considering that trends arise from the content of messages exchanged between users, it is natural that most studies are based on content analysis. In these analyses, the methods based on counting words, weighting their importance, syntactic analysis of the message text in order to identify and extract and obvious and latent topics in it, using vectorization methods in order to calculate the similarity between the meaning of the messages and finally using data mining techniques to find trends. In addition, the methods of analyzing and discovering sentiment from messages are also among the methods studied in this field. The existing limitations of Twitter, including the limitation of the number of message characters, the use of unusual, colloquial and abbreviated discourses, the use of emoticons, the change of discourse literature over time, and the strong dependence of the past methods on language of message, are the major challenges of content analysis-based studies. In order to avoid these challenges and find trends, regardless of the language used in the message, we focused on another aspect of social network analysis, and that is, without referring to the text, the extraction of features that occur when trends and events occur. For this purpose, by examining the metadata characteristics of the message, the related user, and the network structure of that user, as well as using the studies that have been conducted to investigate the role of metadata regarding the popularity of tweets, define measurable and functional characteristics. We used the potential function, which indicates the potential trending index of a tweet, then with the help of this function, we were able to identify and announce trends in the initial stages of their occurrence. By comparing the results of this method with the content-based methods, we came to the conclusion that the structural and metadata analysis of tweets, will lead to similar results in order to discover the ongoing trends with methods based on content analysis.
Keywords:
Trend Detection, Structural Analysis, Trend Potential Function, Anomaly Detection
كليدواژه هاي فارسي
تحليل مبتني برساختار , شناسايي ناهنجاري , تابع پتانسل ترند , تشخيص موضوع داغ
كليدواژه هاي لاتين
Trend Detection , Structural Analysis , Anomaly Detection , Trend Potential Function
Author
Reza Mohammadi
SuperVisor
Dr. Hasan Naderi