چکيده
تعداد متغيرهاي ورودي يا ويژگيهاي يك مجموعه داده به عنوان بُعد آن داده در نظر گرفته ميشود. كاهش ابعاد، به تكنيكهايي گفته ميشود كه تعداد متغيرهاي ورودي در يك مجموعه داده را كاهش ميدهند. ايده اصلي روشهاي كاهش ابعاد نمايش يك مجموعه داده با ابعاد بالا توسط مجموعهاي از چند زيرفضاي با ابعاد پايين ميباشد. هدف از خوشهبندي زيرفضايي، يافتن زيرفضاهاي اصلي داده ميباشد. يكي از روش هاي اخير خوشهبندي زيرفضايي، خوشهبندي زيرفضايي طيفي ميباشد كه از دو مرحله مجزا تشكيل شدهاست. خوشهبندي زيرفضايي طيفي از ساختن ماتريس شباهت و دستيابي به گراف شباهت، و سپس اعمال الگوريتم خوشهبندي طيفي بر روي گراف شباهت، حاصل ميشود. روشهاي خوشهبندي طيفي، از همبستگي بين نمونههاي داده براي ساخت ماتريس شباهت استفاده ميكنند. خوشهبندي زيرفضايي تنك (SSC)و نمايش كمرتبه (LRR) ازجمله رويكردهاي كارآمد خوشهبندي طيفي ميباشند. اين دو روش هر دو مبتني بر بهينهسازي محدب با بهرهگيري از ديدگاه خودبيانگري ميباشند. تفاوت اصلي خوشهبندي زيرفضايي تنك و نمايش كمرتبه اين است كه خوشهبندي زيرفضايي تنك بردارِ نرمl_1 ماتريس نمايش را كمينه ميكند تا منجر به تنكي شود، در حالي كه نمايش كمرتبه نرم هستهاي را كمينه ميكند تا به يك ساختار كمرتبه دست يابد. از آن جا كه ماتريس نمايش اغلب بهصورت تنك و كمرتبه است، الگوريتم جديدي با نام خوشهبندي زيرفضايي تنك و كمرتبه (LRSSC) با تركيب خوشهبندي زيرفضايي تنك و نمايش كمرتبه پيشنهاد شده است،كه تضمينهاي تئوري ارائه شده، موفقيت الگوريتم را بيان ميكنند.