-
شماره ركورد
28052
-
پديد آورنده
حسام الدين مطاعي
-
عنوان
تحليل مقاي سه ا ي عملكرد الگور يتمهاي مدلساز ي موضوعي مبتني بر روشهاي متنكاوي براي تحلي ل دادهها ي موجود در سامانه جامع روابط كار
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع سيستم هاي كلان
-
سال تحصيل
1397
-
تاريخ دفاع
1401/03/18
-
استاد راهنما
محمد فتحيان
-
دانشكده
پيشرفت
-
چكيده
امروزه به دليل حجم بالاي دادههاي متني در دسترس، استفاده از رويكردهاي متنكاوي از اهميت به سزايي برخوردار ميباشد. مدلسازي موضوعي از جمله تكنيكهاي متنكاوي ميباشد كه در كشف موضوعات و سازماندهي به متون نقش به سزايي ايفا ميكند. مدلسازي موضوعي عمدتا تكيه بر تكنيكهاي يادگيري ماشين و هوش مصنوعي ميباشد. در اين مطالعه در گام اول دادخواستهاي ثبتي در سامانه جامع روابط كار جمع آوري گرديد. در گام بعدي دادخواستهاي آزمايشي از مجموعه دادخواست جدا گرديد. در اين مرحله بر روي متون دادخواستها اقدامات پيشپردازشي صورت گرفت. اقداماتي نظير نرمالسازي متون، حذف كلمات ايست و ريشه يابي كلمات در اين مرحله انجام پذيرفت. سپس به دادههاي متني به كمك تكنيك روش فراواني اصطلاح-معكوس فراواني متن ساختار داده شد. در گام بعدي اقداماتي براي تعيين مقدار مطلوب پارامترهاي ورودي الگوريتم مدل موضوعي تخصيص پنهان (دريكله) صورت گرفت. از الگوريتم مدل موضوعي تخصيص پنهان ( دريكله) براي كشف خوشههاي موضوعي متون در اين مطالعه بهره گرفته شده است.در نهايت هجده خوشه موضوعي از مجموعه دادخواستها استخراج گرديد كه به كمك رويكرد موضوعي هر يك از اين خوشهها تفسير و برچسب مناسب به اين خوشهها تخصيص يافت. در انتها با بررسي نمودار توزيع كلمات در خوشه هاي موضوعي مشخص گرديد كه خوشههاي مربوط به موضوعات حقوق معوقه، مزاياي مستمر نقدي قرارداد، درخواست بيمه بيكاري، درخواست بيمه بيكاري-كرونا از خوشه هاي موضوعي راهبردي و پراهميت در دادخواست هاي ثبتي سمت كارگر ميباشند.
-
تاريخ ورود اطلاعات
1402/01/14
-
عنوان به انگليسي
Comparative analysis of the performance of topic modeling algorithms based on text mining methods on Comprehensive labor relations system dataSet
-
تاريخ بهره برداري
6/8/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
حسام الدين مطاعي
-
چكيده به لاتين
Today, due to the large volume of available textual data, the use of text mining approaches is
very important. Topic modeling is one of the text mining techniques that plays an important
role in discovering topics and organize texts. Topic modeling mainly relies on machine learning
techniques and artificial intelligence. In this study, in the first step, registed employee
complaint were collected from comprehensive labor relations system. In the next step,
experimental complaint were separated from other complaint. At this stage, pre-processing
activities were taken on the texts of the complaint. Activities such as normalizing texts, deleting
stop words, and rooting words were performed at this stage. Then the textual data were
structured by using TF-IDF technique. In the next step, steps were taken to determine the
optimal value of the input parameters of the hidden allocation thematic model algorithm
(drikle). The hidden allocation thematic model algorithm (drikle) has been used to discover the
thematic clusters of texts in this study. Finally, eighteen thematic clusters were extracted from
the set of complaint, which were interpreted and assigned the appropriate label to each of these
clusters with thematic approach
-
كليدواژه هاي فارسي
متنكاوي , تحليل موضوعي , مدلسازي موضوعي
-
كليدواژه هاي لاتين
Text mining , Thematic analysis , Topic Modeling
-
Author
hesam din motaei
-
SuperVisor
Dr. Mohammad Fathian
-
لينک به اين مدرک :