-
شماره ركورد
14099
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
14099
-
پديد آورنده
سعيد عادل مهربان
-
عنوان
خوشهبندي توزيعشده و موازي دادههاي با حجم بسيار زياد كاربرد در دادههاي شبكه
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
هوش مصنوعي
-
سال تحصيل
دي ماه 1391
-
تاريخ دفاع
دي ماه 1391
-
استاد راهنما
دكتر احمد اكبري
-
دانشكده
كامپيوتر
-
چكيده
چكيده
مسئلهٔ پردازش و تحليل دادههاي عظيم به لطف فراهم شدن امكانات آن در حال رشد است. امروزه براي نگهداري، پردازش و تحليل دادههاي عظيم، بسترهاي متنوّعي نظير هدوپ، اسپارك، پرستو و ايمپالا معرّفي شدهاند كه هر يك نتيجهٔ سالها فعّاليّت در حوزهٔ دادههاي عظيم به شمار ميروند. پژوهشگران ميتوانند به كمك اين بسترهاي متنوّع، انواع روشهاي تحليل و پردازش را بر روي دادههايي با حجم بسيار زياد انجام دهند. تنها مسئلهاي كه باقي ميماند، استفاده از روشهايي متناسب با مدلهاي پردازشي اين بسترها نظير مدل نگاشتكاهش است.
خوشهبندي به عنوان يكي از روشهاي بيناظر تشخيص الگوهاي پنهان شناخته ميشود و تحليل حجم عظيم دادههاي شبكه ميتواند به حل شدن مشكلاتي نظير نرخ فراوان مثبتهاي اشتباه در تشخيص ناهنجاري منجر گردد. از اين رو در اين پژوهش روشي جهت خوشهبندي توزيعشده و موازي دادههاي با حجم زياد با تمركز بر دادههاي شبكه ارائه شده است. روش پيشنهادي در دسته روشهاي خوشهبندي مبتني بر چگالي قرار دارد چرا كه اين روشها براي خوشهبندي دادههاي شبكه از كيفيت مناسبي برخوردار هستند.
روش پيشنهادي شامل چهار مرحلهٔ تقسيم فضاي داده، خوشهبندي محلّي، ادغام نتايج و برچسبزني دوباره است كه همگي اين مراحل در مدل نگاشتكاهش ارائه شدهاند. از اين رو ميتوان تمامي مراحل خوشهبندي را در چارچوبي يكپارچه اجرا كرد. در ارائهٔ روش خوشهبندي محلّي تمركز بر ارائهٔ روشي جهت شناسايي خوشههاي با چگالي متفاوت بوده است چرا كه دادههاي مربوط به خوشههاي مختلف شبكه چنين خصوصيتي دارند. نتايج ارزيابي بصري و معيارهاي ارزيابي خوشهبندي به خوبي توانايي اين روش را در شناسايي خوشهها اثبات ميكنند. نتايج ارزيابي خوشهبندي دادههاي شبكه نيز نشان ميدهد روش خوشهبندي توزيعشده كه در اين پژوهش ارائه شده است به نسبت روشهاي رقيب، خوشههايي با كيفيت به مراتب بهتر ارائه ميكند.
در نهايت ضمن ارزيابي تأثير پارامتر انعطافپذيري، به عنوان پارامتر اصلي روش پيشنهادي، رهنمودهايي جهت انتخاب مقدار اين پارامتر ارائه شده است تا مقدار اين پارامتر با توجّه به ويژگيهاي كيفي مورد انتظار براي خوشههاي موجود در داده، اين پارامتر انتخاب گردد.
واژههايكليدي:دادههاي عظيم، خوشهبندي مبتني بر چگالي، خوشهبندي توزيعشده، دادهكاوي
-
لينک به اين مدرک :