چکيده
كلانداده اصطلاحي است كه براي مجموعه داده هاي بسيار حجيم و با ساختار پيچيده به كار ميرود. اين مشخصات به همراه خود، چالشهايي در نحوه ذخيرهسازي، بررسي و اعمال روشهاي سنتي موجود و استخراج نتايج به همراه دارند. تجزيه و تحليل دادههاي كلان اصطلاحي است كه براي توصيف فرآيند تحقيق اين دادههاي پيچيده به منظور آشكار كردن الگوهاي ناشناخته مورد استفاده قرار ميگيرد. با رشد چشمگير دادهها در سالهاي اخير، حريم خصوصي به يكي از دغدغههاي اين حوزه تبديل شده است؛ با اين حال همواره ميان حريم خصوصي و امنيت دادههاي كلان با استفاده گسترده از آن، يك مغايرت وجود دارد. براي رفع اين مشكل، مدلها و الگوريتمهاي گوناگوني توسعه داده شدهاند اما اكثر آنها از يك معزل رنج ميبرند: رشد سريع ابعاد
دادهها؛ از اين رو الگوريتمها و روشهاي سنتي و متداول پاسخگو نميباشند. حفظ حريم خصوصي در دادهها دغدغه اصلي و هميشگي بوده است. همانطور كه بيان شد، روشهاي پايه و اوليه بر ميزان كارايي و حفظ حريم خصوصي تمركز دارند اما در اين حجم از داده، مشكل مقياسپذيري را دارند. از اين رو، حفظ حريم خصوصي يكي از چالشهاي اصلي در دادههاي كلان به شمار ميآيد. در اين سمينار، ابتدا به مفاهيم پايه اين حوزه پرداخته شده و سپس چارچوب اصلي و روشهاي موجود براي اين فرآيند بررسي ميشود.