• شماره ركورد
    28052
  • پديد آورنده

    حسام الدين مطاعي

  • عنوان
    تحليل مقاي سه ا ي عملكرد الگور يتمهاي مدلساز ي موضوعي مبتني بر روشهاي متنكاوي براي تحلي ل دادهها ي موجود در سامانه جامع روابط كار
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي صنايع سيستم هاي كلان
  • سال تحصيل
    1397
  • تاريخ دفاع
    1401/03/18
  • استاد راهنما
    محمد فتحيان
  • دانشكده
    پيشرفت
  • چكيده
    امروزه به دليل حجم بالاي داده‌هاي متني در دسترس، استفاده از رويكرد‌هاي متن‌كاوي از اهميت به سزايي برخوردار مي‌باشد. مدلسازي موضوعي از جمله تكنيك‌هاي متن‌‌كاوي مي‌باشد كه در كشف موضوعات و سازماندهي به متون نقش به سزايي ايفا مي‌كند. مدلسازي موضوعي عمدتا تكيه بر تكنيك‌هاي يادگيري ماشين و هوش مصنوعي مي‌باشد. در اين مطالعه در گام اول دادخواست‌هاي ثبتي در سامانه جامع روابط كار جمع آوري گرديد. در گام بعدي دادخواست‌هاي آزمايشي از مجموعه دادخواست جدا گرديد. در اين مرحله بر روي متون دادخواست‌ها اقدامات پيش‌پردازشي صورت گرفت. اقداماتي نظير نرمال‌سازي متون، حذف كلمات ايست و ريشه يابي كلمات در اين مرحله انجام پذيرفت. سپس به داده‌هاي متني به كمك تكنيك روش فراواني اصطلاح-معكوس فراواني متن ساختار داده شد. در گام بعدي اقداماتي براي تعيين مقدار مطلوب پارامتر‌هاي ورودي الگوريتم مدل موضوعي تخصيص پنهان (دريكله) صورت گرفت. از الگوريتم مدل موضوعي تخصيص پنهان ( دريكله) براي كشف خوشه‌هاي موضوعي متون در اين مطالعه بهره گرفته شده است.در نهايت هجده خوشه موضوعي از مجموعه دادخواست‌ها استخراج گرديد كه به كمك رويكرد موضوعي هر يك از اين خوشه‌ها تفسير و برچسب مناسب به اين خوشه‌ها تخصيص يافت. در انتها با بررسي نمودار توزيع كلمات در خوشه هاي موضوعي مشخص گرديد كه خوشه‌هاي مربوط به موضوعات حقوق معوقه، مزاياي مستمر نقدي قرارداد، درخواست بيمه بيكاري، درخواست بيمه بيكاري-كرونا از خوشه هاي موضوعي راهبردي و پراهميت در دادخواست هاي ثبتي سمت كارگر مي‌باشند.
  • تاريخ ورود اطلاعات
    1402/01/14
  • عنوان به انگليسي
    Comparative analysis of the performance of topic modeling algorithms based on text mining methods on Comprehensive labor relations system dataSet
  • تاريخ بهره برداري
    6/8/2023 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    حسام الدين مطاعي

  • چكيده به لاتين
    Today, due to the large volume of available textual data, the use of text mining approaches is very important. Topic modeling is one of the text mining techniques that plays an important role in discovering topics and organize texts. Topic modeling mainly relies on machine learning techniques and artificial intelligence. In this study, in the first step, registed employee complaint were collected from comprehensive labor relations system. In the next step, experimental complaint were separated from other complaint. At this stage, pre-processing activities were taken on the texts of the complaint. Activities such as normalizing texts, deleting stop words, and rooting words were performed at this stage. Then the textual data were structured by using TF-IDF technique. In the next step, steps were taken to determine the optimal value of the input parameters of the hidden allocation thematic model algorithm (drikle). The hidden allocation thematic model algorithm (drikle) has been used to discover the thematic clusters of texts in this study. Finally, eighteen thematic clusters were extracted from the set of complaint, which were interpreted and assigned the appropriate label to each of these clusters with thematic approach
  • كليدواژه هاي فارسي
    متن‌كاوي , تحليل موضوعي , مدلسازي موضوعي
  • كليدواژه هاي لاتين
    Text mining , Thematic analysis , Topic Modeling
  • Author
    hesam din motaei
  • SuperVisor
    Dr. Mohammad Fathian