-
شماره ركورد
26688
-
پديد آورنده
مهسا آذرشب
-
عنوان
ارائه يك الگوريتم خوشه بندي متون با بهره گيري از الگوريتم هاي جديد فرا ابتكاري
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع
-
سال تحصيل
1398
-
تاريخ دفاع
1401/2/19
-
استاد راهنما
محمد فتحيان
-
استاد مشاور
بابك اميري
-
دانشكده
مهندسي صنايع
-
چكيده
در عصر حاضر هم¬زمان با پيشرفت تكنولوژي، روزانه حجم بالايي از داده¬هاي متني غير ساخت يافته توليد مي¬شود. انجام يك سازمان¬دهي اتوماتيك (بدون دخالت و تعامل انساني) براي اين اسناد ديجيتالي، حياتي و ارزشمند است. خوشه بندي متون يكي از مفيدترين و پركاربردترين روش¬هاي سازمان¬د¬هي اين اسناد محسوب مي¬شود. اين اسناد متني، حاوي ويژگي¬هاي پراكنده و غيرآموزنده¬اي هستند كه بر اثربخشي روش خوشه¬بندي متن تأثير مي¬گذارند. از تكنيك انتخاب ويژگي مي¬توان جهت حذف ويژگي¬هاي غيرآموزنده استفاده كرد. مسئله انتخاب ويژگي را مي¬توان به صورت يك مسئله بهينه¬سازي مطرح كرد و به منظور حل آن از الگوريتم¬هاي فرا ابتكاري بهره برد. در ادبيات از فرا ابتكاري¬ها با رويكردهاي متفاوتي براي حل اين مسئله استفاده شده است. اما همچنان بهبود انتخاب ويژگي و به تبع آن خوشه بندي متن يك مسئله قابل بهبود و مورد بحث در تحقيقات است. الگوريتم بهينه سازي مبتني بر آموزش و يادگيري يكي از جديدترين الگوريتم¬هاي فرا ابتكاري است و داراي مزايايي از جمله سرعت همگرايي بالا و مواجه نبودن با مشكلات تنطيم پارامتر مي¬باشد. از اين الگوريتم در ادبيات براي حل مسائل مختلفي استفاده شده و به نتايج خوبي دست يافته اند. به اين منظور در اين تحقيق چگونگي بهره گيري از اين الگوريتم براي بهبود انتخاب ويژگي و خوشه بندي متون بررسي شده و يك الگوريتم تركيبي با استفاده از بهينه¬سازي مبتني بر آموزش و يادگيري، گرگ خاكستري و الگوريتم ژنتيك ارائه شده است. عملكرد الگوريتم¬ پيشنهادي با تعدادي از مقالات مشابه مقايسه مي شود. الگوريتم پيشنهادي با در نظر گرفتن معيارهاي رايج سنجش خوشه¬بندي، كاهش ابعاد و رفتار همگرايي بهبود قابل توجهي را ايجاد مي¬كند.
-
تاريخ ورود اطلاعات
1401/03/29
-
عنوان به انگليسي
Proposing a text clustering algorithm using novel meta-heuristic algorithms
-
تاريخ بهره برداري
5/9/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مهسا اذرشب
-
چكيده به لاتين
Nowadays, with the advancement of technology, a large amount of unstructured data is being generated. Textual data account for a large proportion of unstructured human-generated data. Therefore, because the number of digital documents is increasing rapidly, an automatic organization (without human intervention and interaction) is vital and valuable for these documents. Text clustering, as a process of dividing a collection of documents based on their similarity to separate subsets, is one of the most useful and widely used methods of organizing these documents. One of the factors affecting the quality and accuracy of clustering is the size of these documents. In fact, text documents contain scattered and uninformative features that affect the effectiveness of the text clustering method. The feature selection technique can be used to remove uninformative features and improve text clustering performance. The problem of feature selection and text clustering can be considered as an optimization problem and meta-heuristic algorithms can be used to solve it. In this research, a hybrid algorithm based on teaching-learing-based optimization and grey wolf optimization is proposed in order to enhance the feature selection and text clustering performance. To evaluate the proposed algorithm, several optimization algorithms, which are recently used to solve the same issue are simulated. The results indicate that the proposed algorithm makes a significant improvement by considering the common clustering evaluation measures.
-
كليدواژه هاي فارسي
خوشه¬بندي متن , انتخاب ويژگي , الگوريتم بهينه سازي مبتني بر آموزش و يادگيري , الگوريتم گرگ خاكستري , الگوريتم ژنتيك
-
كليدواژه هاي لاتين
Text clustering , feature selection , teaching-learning-based optimization , grey wolf optimization , genetic algorithm
-
Author
mahsa azarshab
-
SuperVisor
mohammad fathian
-
لينک به اين مدرک :