-
شماره ركورد
25791
-
پديد آورنده
زهرا صابري
-
عنوان
تشخيص ايستايش در شبكه هاي اجتماعي با استفاده از يادگيري عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر-نرم افزار
-
سال تحصيل
1397
-
تاريخ دفاع
1399/12/23
-
استاد راهنما
عين اله خنجري ميانه
-
استاد مشاور
بهروز مينايي بيدگلي
-
دانشكده
مهندسي كامپيوتر
-
چكيده
تشخيص ايستايش به تشخيص موضعگيري نويسنده از روي متن، نسبت به يك موضوع خاص گفته ميشود. رشد چشمگير استفاده از شبكه هاي اجتماعي برخط، مقادير زيادي داده متني را در دسترس پژوهشگران قرار داده كه براي اهداف مختلف به كار گرفته مي شود. تشخيص ايستايش و وظايف مشابه آن در اهدافي همچون اطلاع از عقيده عمومي جامعه، تحليل بازار، تبليغات هدفمند و پيش بيني نتايج رخدادهاي اجتماعي مثل انتخابات استفاده مي شوند كه از اين جهت حائز اهميتند. در اين پژوهش، تشخيص ايستايش در متون فارسي موجود در شبكه هاي اجتماعي برخط، مورد مطالعه قرار مي گيرد. به اين منظور ابتدا دادگاني را از توييتر جمع آوري و برچسب گذاري كرده، سپس از آن به عنوان دادگان آزمون استفاده مي كنيم. به دليل كمبود منابع فارسي براي اين وظيفه، از روشهاي بين زباني كمك مي گيريم. به عبارتي، در زماني كه دادگان آموزش براي وظيفه تشخيص ايستايش فراهم نيست، راه حلي جايگزين براي انجام اين وظيفه پيشنهاد مي دهيم. شبكه عميق mBERT عملكرد مناسبي را در تنظيمات بين زباني براي وظايفي همچون شناسايي موجوديت نام دار و برچسب گذاري اجزاي سخن از خود نشان داده است. به همين دليل، ابتدا عملكرد mBERT را بر روي دادگان جمع آوري شده ارزيابي مي كنيم. سپس مدلي را بر اساس روش يادگيري چندوظيفگي پيشنهاد مي كنيم كه در تشخيص ايستايش فارسي به طور معناداري، بهتر از مدل mBERT عمل مي كند. نتايج آزمايش هاي ما نشان مي دهند كه در شرايط كمبود يا نبود منابع آموزش، استفاده از دادگان وظايف مشابه و يادگيري چندوظيفگي، عملكرد قابل قبول مدل را براي انجام وظيفه موردنظر ممكن مي سازند. مدل پيشنهادي ما بدون دادگان آموزش، به طور معناداري بهتر از mBERT عمل مي كند.
-
تاريخ ورود اطلاعات
1400/09/06
-
عنوان به انگليسي
Stance Detection in Social Networks Using Deep Learning
-
تاريخ بهره برداري
3/14/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
زهرا صابري
-
چكيده به لاتين
Stance detection aims to determine the position of a text's author towards a predefined target. The widespread adoption of online social networks has provided a huge amount of text data for research. Stance detection has application in understanding public opinion, market analysis, targeted advertising and predicting the results of social events like elections. Our main focus is stance detection in Persian. We provide the first Persian Twitter stance detection dataset by collecting and annotating text data from twitter, then use it as our test set. We utilize cross-lingual methods because of training data shortage in Persian for the task. In other words, we propose an alternative method to perform stance detection when training data does not exist or is not sufficient. mBERT has showed promising results in cross-lingual named entity recognition and part of speech tagging. Therefore, mBERT is evaluated on our dataset first. Then, we propose a deep model based on multi-task learning which significantly outperforms mBERT. Our experiments show that in case of training data deficiency, utilizing datasets of similar tasks (to the target task) and multi-task learning makes acceptable results for the target task possible. Our proposed model significantly outperforms mBERT in zero-shot settings.
-
كليدواژه هاي فارسي
تشخيص ايستايش , يادگيري عميق , شبكه هاي اجتماعي , يادگيري چندوظيفگي
-
كليدواژه هاي لاتين
Stance Detection , Deep learning , Social Networks , Multi-task Learning
-
لينک به اين مدرک :