محمدرضا لرستاني

عنوان

ارائه الگوريتمي جهت پنهان سازي قواعد انجمني با حفظ حريم خصوصي و كيفيت داده ها

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

كامپيوتر - نرم‌افزار

سال تحصيل

دي ماه 1393

تاريخ دفاع

دي ماه 1393

استاد راهنما

دكتر عين اله خنجري

چكيده

چكيده حفظ حريم خصوصي در داده¬كاوي يك حوزه نسبتاً جديد در داده¬كاوي است كه نزديك به يك دهه از پيدايش آن مي¬گذرد. اين حوزه، اثرات جانبي روش¬هاي داده¬كاوي را كه باعث نفوذ به حريم خصوصي افراد و سازمان¬ها مي¬شود مورد بررسي قرار مي¬دهد. اكثر راهكارهاي ارائه شده در دو جهت اصلي طبقه¬بندي مي¬شوند: 1) راهكارهاي پنهان¬سازي داده و 2) راهكارهاي پنهان¬سازي دانش. جهت اول شامل متدلوژي-هايي مي¬شود كه بررسي مي¬كنند چگونه قبل از جريان كاوش داده¬ها، حريم خصوصي داده¬هاي خام يا اطلاعات، حفظ شود. هدف اين راهكارها، حذف اطلاعات محرمانه يا اطلاعات خصوصي از داده¬هاي اصلي، قبل از افشاي آن¬هاست و با تكنيك¬هايي مثل اختلال داده، نمونه¬سازي داده، عمومي¬سازي يا حذف داده و تبديل داده انجام مي¬شود. جهت دوم شامل متدلوژي¬هايي مي¬شود كه هدف آن¬ها محافظت از نتايج داده-كاوي است كه با تكنيك¬هاي مختلف داده¬كاوي در پايگاه داده اصلي استخراج مي¬شوند. اين راهكارها، با تكنيك¬هاي اعوجاج داده و مسدود كردن داده انجام شده كه مانع انتشار دانش حساس در داده¬هاي افشاءشده مي¬شود. در اين پايان¬نامه، بر پنهان¬سازي دانش حساس متمركز شده و يك كلاس خاص از راهكارها را كه پنهان-سازي قواعد انجمني ناميده مي¬شود بررسي مي¬كنيم. ممكن است از نظر صاحب داده¬ها، بعضي قواعد استخراج شده، نقض¬كننده حريم خصوصي باشند، بنابراين بايد الگوريتمي ارائه شود كه پس از اجرا بر روي پايگاه داده¬اي از تراكنش¬ها، حريم خصوصي را حفظ كرده و نيز كمترين تغييرات را بر روي داده¬ها اعمال ¬كند. در اينجا، الگوريتمي ارائه خواهد شد كه ضمن حفظ حريم خصوصي در استخراج قواعد انجمني، كمترين تغييرات را بر روي پايگاه داده¬ها اعمال كرده و باعث مي¬شود كه نتايج داده¬كاوي معتبري نيز توليد شود. ما اين كار را با ساخت پايگاه داده¬اي از اقلام انجام مي¬دهيم و مشخص مي¬كنيم هر قلم در چه تراكنش¬هايي آمده است و در ادامه تراكنشي كه قواعد حساس بيشتري را شامل مي¬شوند به عنوان تراكنش حساس انتخاب كرده و قلم حساس نيز از اقلامي كه بيشترين تكرار را در قواعد حساس دارد، انتخاب مي¬كنيم. نتايج به دست آمده از الگوريتم پيشنهادي نشان مي¬دهد كه ضمن پويش يكبار پايگاه داده، پنهان¬سازي قواعد حساس را انجام داده و قواعد شبح نيز توليد نمي¬كند، از طرفي نسبت به الگوريتم¬هاي ديگر، درصد كمتري از قواعد غيرحساس را پنهان مي¬كند. واژه‌هاي كليدي:داده¬كاوي با حفظ حريم خصوصي- پنهان¬سازي قواعد انجمني- خرابي پنهان¬سازي- از دست رفتن قواعد- قواعد شبح

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=13691&Field=0&DTC=6