چکيده
شبكههاي اجتماعي مانند فيسبوك و توييتر در حال تبديل شدن به بخشي از زندگي روزانه ما هستند. صدها شبكه اجتماعي وجود دارند كه هر كدام برخدمات و ويژگيهاي مخصوص به خود تمركز كردهاند. جمع-آوري تمام دادههاي مرتبط با يك شخص بر روي چندين شبكه اجتماعي و درهم¬آميختن آنها در قالب يك نمايه ميتواند جهت رسيدن به اهداف متعددي مفيد واقع شود. شبكههاي اجتماعي مزايايي مانند گمنامي، سرعت بالا و دسترسي به اطلاعات به اشتراك گذاشته شده كاربران را دارا ميباشند. اين مزايا باعث ايجاد حسابهاي كاربري غيرواقعي ميشود كه در فعاليتهاي فريبكارانه و كلاهبرداري عليه كاربران ديگر بكار گماشته ميشوند. روشهاي مختلفي جهت تشخيص نمايههاي جعلي در شبكههاي اجتماعي وجود دارد. برخي از اين روشها از تطابق موجوديتها استفاده ميكنند. تطابق موجوديتها يك اقدام مهم در زمينه ادغام و پاك¬سازي داده¬ها است. در واقع روشي است براي شناسايي موجوديتهايي كه به يك موجوديت واقعي اشاره ميكنند. موجوديتهاي مورد بررسي ممكن است در دادههاي توزيعشده و ناهمگن يا در يك منبع داده واحد باشند. زماني كه موجوديتها ناهمگن باشند يا كيفيت دادهها پايين باشد، تطابق موجوديت¬ها كاري چالشبرانگيز خواهد بود. در اين سمينار سعي بر معرفي روشهاي خلاقانه جهت ارتباطدهي بين نمايههاي متعدد ايجاد شده توسط يك شخص و تشخيص هويت اصلي يك كاربر است. با استفاده از استخراج ويژگيها و تكنيكهاي يادگيري نظارت شده، ما دستهبندهايي را توسعه ميدهيم كه ميتوانند تطابق موجوديتها را جهت سناريوهاي زير انجام دهند: (الف) تطابق موجوديتهاي نمايههاي دو و يا بيش از دو شبكه اجتماعي با يكديگر؛ (ب) جستجوي يك كاربر بر اساس اسامي مشابه؛ (ج) آشكارسازي هويت يك كاربر.