شماره ركورد
13691
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
13691
پديد آورنده
محمدرضا لرستاني
عنوان
ارائه الگوريتمي جهت پنهان سازي قواعد انجمني با حفظ حريم خصوصي و كيفيت داده ها
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كامپيوتر - نرمافزار
سال تحصيل
دي ماه 1393
تاريخ دفاع
دي ماه 1393
استاد راهنما
دكتر عين اله خنجري
چكيده
چكيده
حفظ حريم خصوصي در داده¬كاوي يك حوزه نسبتاً جديد در داده¬كاوي است كه نزديك به يك دهه از پيدايش آن مي¬گذرد. اين حوزه، اثرات جانبي روش¬هاي داده¬كاوي را كه باعث نفوذ به حريم خصوصي افراد و سازمان¬ها مي¬شود مورد بررسي قرار مي¬دهد. اكثر راهكارهاي ارائه شده در دو جهت اصلي طبقه¬بندي مي¬شوند: 1) راهكارهاي پنهان¬سازي داده و 2) راهكارهاي پنهان¬سازي دانش. جهت اول شامل متدلوژي-هايي مي¬شود كه بررسي مي¬كنند چگونه قبل از جريان كاوش داده¬ها، حريم خصوصي داده¬هاي خام يا اطلاعات، حفظ شود. هدف اين راهكارها، حذف اطلاعات محرمانه يا اطلاعات خصوصي از داده¬هاي اصلي، قبل از افشاي آن¬هاست و با تكنيك¬هايي مثل اختلال داده، نمونه¬سازي داده، عمومي¬سازي يا حذف داده و تبديل داده انجام مي¬شود. جهت دوم شامل متدلوژي¬هايي مي¬شود كه هدف آن¬ها محافظت از نتايج داده-كاوي است كه با تكنيك¬هاي مختلف داده¬كاوي در پايگاه داده اصلي استخراج مي¬شوند. اين راهكارها، با تكنيك¬هاي اعوجاج داده و مسدود كردن داده انجام شده كه مانع انتشار دانش حساس در داده¬هاي افشاءشده مي¬شود.
در اين پايان¬نامه، بر پنهان¬سازي دانش حساس متمركز شده و يك كلاس خاص از راهكارها را كه پنهان-سازي قواعد انجمني ناميده مي¬شود بررسي مي¬كنيم.
ممكن است از نظر صاحب داده¬ها، بعضي قواعد استخراج شده، نقض¬كننده حريم خصوصي باشند، بنابراين بايد الگوريتمي ارائه شود كه پس از اجرا بر روي پايگاه داده¬اي از تراكنش¬ها، حريم خصوصي را حفظ كرده و نيز كمترين تغييرات را بر روي داده¬ها اعمال ¬كند.
در اينجا، الگوريتمي ارائه خواهد شد كه ضمن حفظ حريم خصوصي در استخراج قواعد انجمني، كمترين تغييرات را بر روي پايگاه داده¬ها اعمال كرده و باعث مي¬شود كه نتايج داده¬كاوي معتبري نيز توليد شود. ما اين كار را با ساخت پايگاه داده¬اي از اقلام انجام مي¬دهيم و مشخص مي¬كنيم هر قلم در چه تراكنش¬هايي آمده است و در ادامه تراكنشي كه قواعد حساس بيشتري را شامل مي¬شوند به عنوان تراكنش حساس انتخاب كرده و قلم حساس نيز از اقلامي كه بيشترين تكرار را در قواعد حساس دارد، انتخاب مي¬كنيم.
نتايج به دست آمده از الگوريتم پيشنهادي نشان مي¬دهد كه ضمن پويش يكبار پايگاه داده، پنهان¬سازي قواعد حساس را انجام داده و قواعد شبح نيز توليد نمي¬كند، از طرفي نسبت به الگوريتم¬هاي ديگر، درصد كمتري از قواعد غيرحساس را پنهان مي¬كند.
واژههاي كليدي:داده¬كاوي با حفظ حريم خصوصي- پنهان¬سازي قواعد انجمني- خرابي پنهان¬سازي- از دست رفتن قواعد- قواعد شبح