چکيده
امروزه با توجه به افزايش روزافزون حجم داده ها و پيچيدگي پردازش ها ، نياز به بسترهاي ذخيره سازي جديد احساس مي شود و بايد از پايگاه داده غير رابطه اي استفاده كرد. از سوي ديگر حجم زياد داده ها ، مفهومي به نام كلان داده را مطرح مي سازد. ماهيت داده هاي مورد بررسي به گونه اي است كه به صورت توزيع شده بر روي چندين سرور قرار دارند . از اين رو پايگاه داده مبتني بر پرس و جو انتخاب شده است . اين نوع پايگاه داده بر اساس پرس و جوها اقدام به ايجاد جداول مي نمايد و ارتباط و وابستگي بين جداول وجود ندارد . لذا بازيابي اطلاعات با سرعت بيشتري انجام مي شود.
به دليل توزيع شدگي داده ها ، بايد از الگوريتم هاي خوشه بندي توزيع شده استفاده كنيم .
نوع ديگر خوشه بندي كه مدنظر است خوشه بندي پرس و جوها براي طراحي دقيق تر پايگاه داده مي باشد. در اين حالت پرس و جوها بر اساس معيارهايي نظير جداول مورد جستجو، تعداد فيلدهاي مشابه و غيره خوشه بندي مي شوند.
هدف از اين سمينار يافتن الگوريتم هاي خوشه بندي مناسب و پياده سازي آن ها بر روي داده هاي مورد نظر است. داده هاي مورد بررسي در اين سمينار مرتبط با تجهيزات صنعتي موجود در ايران است. بنابراين هدف از خوشه بندي اين است كه بتوان تجهيزات موجود را بر اساس معيارهاي شباهتي كه دارند طبقه بندي كرد و از اين طريق به وابستگي بين آن ها پي برد.