سمانه آهنگر

عنوان

خوشه‌بندي عميق افزايشي براساس مرز خوشه‌ها

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي كامپيوتر گرايش هوش مصنوعي

سال تحصيل

1397

تاريخ دفاع

1401/02/27

استاد راهنما

دكتر ناصر مزيني

استاد مشاور

دكتر محمدرضا محمدي

دانشكده

مهندسي كامپيوتر

چكيده

داده‌ها همواره جمع‌آوري مي‌شوند و تحليل آن‌ها نيازمند روشي است كه هربار تنها با دادگان جديد به‌روزرساني شود و نيازي به تمامي دادگان نباشد. همچنين ذخيره مجموعه دادگان به دليل حجم روزافزون آن مي‌تواند چالش برانگيز باشد. خوشه‌بندي افزايشي يك روش اساسي براي حل مشكل خوشه‌بندي با رشد داده‌هاي بزرگ است. اين الگوريتم‌ها بايد تنها خلاصه‌اي از خوشه‌ها را ذخيره كرده و هر بار كه داده‌ي جديدي مي‌رسد، نتايج را با توجه به خوشه‌هاي قبلي به‌روزرساني كنند. از طرفي در تحليل داده‌هاي تصويري، استخراج بازنمايي‌هاي مناسب، در نتيجه‌ي خوشه‌بندي بسيار مؤثر است. در اين پايان‌نامه يك الگوريتم خوشه‌بندي افزايشي براي دادگان تصويري چهره ارائه مي‌شود، كه دادگان را براساس تراكم، خوشه‌بندي مي‌كند و تنها اطلاعات مرزي خوشه‌ها را نگه مي‌دارد كه در كاهش حافظه مصرفي موثر است. تعداد و شكل خوشه‌ها با رسيدن دادگان جديد همواره در حال به‌روزرساني خواهد بود. همچنين شبكه‌ي استخراج بازنمايي‌هاي خوشه‌گرا در مدل پيشنهادي، بطور مداوم با اضافه شدن دادگان جديد، بصورت خودناظر بهبود مي‌يابد. نتايج نشان مي‌دهد كه دقت خوشه‌بندي در شبكه استخراج بازنمايي به خوبي مدل غيرافزايشي آن است. شبكه پيشنهادي از ابتدا نيازي به تمامي دادگان ندارد و خوشه‌بندي نهايي براي ذخيره دادگان، استفاده از حافظه را در بخش استخراج بازنمايي 50% ، و در قسمت ذخيره بردارهاي مرزي در مجموعه دادگان استفاده شده 58% كاهش مي‌دهد.

تاريخ ورود اطلاعات

1401/05/30

عنوان به انگليسي

Incremental Deep Clustering based on the Boundary of Clusters

تاريخ بهره برداري

5/17/2023 12:00:00 AM

دانشجوي وارد كننده اطلاعات

سمانه اهنگر

Name: سمانه اهنگر
Author: سمانه آهنگر

چكيده به لاتين

Data is collected continuously, and analysis requires a method that only updates results with new data and does not require all data. Storing a dataset in memory can be challenging due to its ever-increasing size. Incremental clustering is an essential way to solve the clustering problem with Big Data growth. These algorithms should store only a summary of the clusters and efficiently update the current clustering result whenever new data arrives. For image data analysis, cluster-oriented representations of the dataset are very effective in clustering results. This thesis proposes an incremental clustering algorithm for the face image dataset, which clusters data based on density and stores only the cluster boundary information, which reduces memory usage. The number of clusters and their shapes is updated constantly with the arrival of new data. Also, the self-supervised network for extraction of cluster-oriented representations in the proposed model improved continuously with new data. The result shows that the clustering accuracy of the representation extraction network is as well as the non-incremental model. The proposed network does not require all data, and the final clustering reduces memory usage by 50% in feature extraction and 58% for boundary information storage.

كليدواژه هاي فارسي

خوشه‌بندي افزايشي , بازنمايي خوشه‌گرا , اطلاعات مرزي خوشه‌ها , حافظه مصرفي , خودناظر

كليدواژه هاي لاتين

Incremental clustering , Cluster-oriented representations , Cluster boundary information , Memory usage , Self-supervised

Author

Samane Ahangar

SuperVisor

Dr. Naser Mozayani

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=26869&Field=0&DTC=6