-
شماره ركورد
26869
-
پديد آورنده
سمانه آهنگر
-
عنوان
خوشهبندي عميق افزايشي براساس مرز خوشهها
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر گرايش هوش مصنوعي
-
سال تحصيل
1397
-
تاريخ دفاع
1401/02/27
-
استاد راهنما
دكتر ناصر مزيني
-
استاد مشاور
دكتر محمدرضا محمدي
-
دانشكده
مهندسي كامپيوتر
-
چكيده
دادهها همواره جمعآوري ميشوند و تحليل آنها نيازمند روشي است كه هربار تنها با دادگان جديد بهروزرساني شود و نيازي به تمامي دادگان نباشد. همچنين ذخيره مجموعه دادگان به دليل حجم روزافزون آن ميتواند چالش برانگيز باشد. خوشهبندي افزايشي يك روش اساسي براي حل مشكل خوشهبندي با رشد دادههاي بزرگ است. اين الگوريتمها بايد تنها خلاصهاي از خوشهها را ذخيره كرده و هر بار كه دادهي جديدي ميرسد، نتايج را با توجه به خوشههاي قبلي بهروزرساني كنند. از طرفي در تحليل دادههاي تصويري، استخراج بازنماييهاي مناسب، در نتيجهي خوشهبندي بسيار مؤثر است.
در اين پاياننامه يك الگوريتم خوشهبندي افزايشي براي دادگان تصويري چهره ارائه ميشود، كه دادگان را براساس تراكم، خوشهبندي ميكند و تنها اطلاعات مرزي خوشهها را نگه ميدارد كه در كاهش حافظه مصرفي موثر است. تعداد و شكل خوشهها با رسيدن دادگان جديد همواره در حال بهروزرساني خواهد بود. همچنين شبكهي استخراج بازنماييهاي خوشهگرا در مدل پيشنهادي، بطور مداوم با اضافه شدن دادگان جديد، بصورت خودناظر بهبود مييابد. نتايج نشان ميدهد كه دقت خوشهبندي در شبكه استخراج بازنمايي به خوبي مدل غيرافزايشي آن است. شبكه پيشنهادي از ابتدا نيازي به تمامي دادگان ندارد و خوشهبندي نهايي براي ذخيره دادگان، استفاده از حافظه را در بخش استخراج بازنمايي 50% ، و در قسمت ذخيره بردارهاي مرزي در مجموعه دادگان استفاده شده 58% كاهش ميدهد.
-
تاريخ ورود اطلاعات
1401/05/30
-
عنوان به انگليسي
Incremental Deep Clustering based on the Boundary of Clusters
-
تاريخ بهره برداري
5/17/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سمانه اهنگر
-
چكيده به لاتين
Data is collected continuously, and analysis requires a method that only updates results with new data and does not require all data. Storing a dataset in memory can be challenging due to its ever-increasing size. Incremental clustering is an essential way to solve the clustering problem with Big Data growth. These algorithms should store only a summary of the clusters and efficiently update the current clustering result whenever new data arrives. For image data analysis, cluster-oriented representations of the dataset are very effective in clustering results.
This thesis proposes an incremental clustering algorithm for the face image dataset, which clusters data based on density and stores only the cluster boundary information, which reduces memory usage. The number of clusters and their shapes is updated constantly with the arrival of new data. Also, the self-supervised network for extraction of cluster-oriented representations in the proposed model improved continuously with new data. The result shows that the clustering accuracy of the representation extraction network is as well as the non-incremental model. The proposed network does not require all data, and the final clustering reduces memory usage by 50% in feature extraction and 58% for boundary information storage.
-
كليدواژه هاي فارسي
خوشهبندي افزايشي , بازنمايي خوشهگرا , اطلاعات مرزي خوشهها , حافظه مصرفي , خودناظر
-
كليدواژه هاي لاتين
Incremental clustering , Cluster-oriented representations , Cluster boundary information , Memory usage , Self-supervised
-
Author
Samane Ahangar
-
SuperVisor
Dr. Naser Mozayani
-
لينک به اين مدرک :