-
شماره ركورد
8514
-
پديد آورنده
محمدجواد مهدي تبار
-
عنوان
رويكرد تشخيص شخصيت افراد از روي دادگان متن فارسي
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1402
-
استاد راهنما
سيد صالح اعتمادي
-
استاد مشاور
سيد صالح اعتمادي
-
دانشجوي وارد كننده اطلاعات
محمدجواد مهدي تبار
-
تاريخ ورود اطلاعات
1402/06/18
-
دانشكده
كامپيوتر
-
عنوان به انگليسي
personality detection approach on persian dataset
-
چكيده
تشخيص شخصيت افراد از روي متن، امروزه مورد توجه جوامع زيادي قرار گرفته است كه مي توان از مهم ترين آن ها جامعه ي روانشناسان و متخصصان پردازش زبان هاي طبيعي نام برد. در اين پژوهش به بررسي ويژگي شخصيتي افراد فارسي با توجه به تمامي پيام هاي آن ها در شبكه ي اجتماعي توييتر مي پردازيم. در اين پژوهش با روش هاي جستجوي Bio وجستجوي توييت، كاربراني كه كلمه هاي كليدي MBTIرا به كار برده اند مورد بررسي قرار داده ايم و واجدان شرايط را به مجموعه ي داده مان اضافه كرده ايم. و همچنين از طريق پرسشنامه نيز تعدادي كاربر به همراه ويژگي شخصيتي شان جمع آوري كرده ايم. بعد از جمع آوري داده اقدام پاكسازي توييت ها و سپس به تحليل آماري داده هايمان از روش TF-IDFو همچنين بيشترين كلمات به كار گرفته شده كرديم. سپس اقدام به پياده سازي و مقايسه دو معماري كاربردي در علم پردازش زبان هاي طبيعي كرده ايم. معماري هاي پياده سازي شده BiLSTM + Attention و برت به صورت سلسله مراتبي بوده اند. براي معماري اول نيز ميانگين بردارهاي هر توييت را با استفاده از FastText به صورت دنباله به مدل مي دهيم . براي مدل برت به دليل اينكه عمليات دسته بندي بر روي طول بلندي از متن ها صورت مي گرفت معماري برت را به صورت نوين و سلسله مراتبي كه دو برت به صورت متوالي پشت هم قرار مي گرفتند به كار برده ايم به طوري كه با استفاده از اين روش مي توان هر متني با طول دلخواه را با معماري برت پايه دسته بندي كرد. همچنين با روش پنهان سازي كلمات مدل برت را روي داده هاي خود تنظيم دقيق كرده ايم و از وزن هاي آموزش ديده ي آن به عنوان وزن هاي اوليه استفاده كرده ايم. به طور تقريبي عملكرد مدل BiLSTM + Attention با توجه به معماري پيشنهادي كمي بهتر از برت سلسله مراتبي بوده است. درمجموع هر دو مدل عملكرد خوبي با توجه به سخت بودن تشخيص ويژگي هاي شخصيتي از خود نشان داده اند و مي توانند جاي پيشرفت بسياري داشته باشند. در آخر ميتوانيم از مدل آموزش ديده در دنياي واقعي استفاده كنيم به طوري كه با استفاده از متن هاي توليد شده فرد، ويژگي شخصيتي او را از بين 16شخصيت موجود MBTI تشخيص دهيم.
-
كليدواژه ها
توليد برچسب , تشخيص شخصيت , MBTI , توييتر
-
لينک به اين مدرک :