شماره ركورد
10330
عنوان
انواع روشهاي رده بندي در داده هاي جرياني
سال تحصيل
1400-01
استاد راهنما
دكتر حسين رحماني
چکيده
رشد قابل توجه دستگاههاي متصل به اينترنت اشيا (IoT)، استفاده از شبكههاي اجتماعي و همچنين پيشرفت تكنولوژي در حوزههاي مختلف، منجر به افزايش حجم دادههايي شده كه به طور مداوم توسط چندين سيستم توليد ميشوند. براي مثال ميتوان دادههاي توليد شده توسط ترافيك اينترنت، شبكههاي حسگر، جريانهاي كليلك وب و غيره اشاره كرد. با استفاده از يادگيري ماشين ميتوان اطلاعات ارزشمندي را از اين جريانهاي دادهي در حال تكامل به دست آورد.
در عمل، چندين مشكل حياتي هنگام استخراج دانش مفيد از اين دادهها، كه به طور بالقوه نامتناهي هستند، پديدار ميشوند كه عمدتاً به دليل ماهيت در حال تكامل و نرخ بالاي ورود دادهها ميباشد و به ناتواني در ذخيرهسازي كامل دادهها منجر ميشود. برخلاف الگوريتمهاي قديمي دادهكاوي كه دادهها ايستا هستند و امكان پردازش چندين بارهي دادهها وجود دارد، در فضاي جرياني به دليل ماهيت دادهها نياز به الگوريتمهايي است كه به اصطلاح تكگذره باشند بدين معنا كه هر نمونه از داده تنها يك بار توسط الگوريتم پردازش شود. ويژگي ديگري كه لازم است الگوريتمهاي تحليل دادههاي جرياني داشته باشند، توانايي تشخيص رانش مفهوم يا مقابله با آن ميباشد. رانش مفهوم موجب ميشود پس از گذشت زمان، دقت مدلها پايين بيايد لذا لازم است با ترفندهايي مدلها به روز شوند تا پيشبيني به خوبي انجام شود.
ما در اين سمينار به بررسي تعدادي از روشها و الگوريتمهاي پيشنهاد شده براي ردهبندي و استخراج دانش از دادههاي جرياني و روشهايي براي مقابله با رانش مفهوم ميپردازيم و در آخر چارچوبي را براي ردهبندي دادههاي جرياني پيشنهاد ميكنيم.
نام دانشجو
سيده نگار درخشاني
تاريخ ارائه
12/1/2021 12:00:00 AM
متن كامل
73549
پديد آورنده
سيده نگار درخشاني
تاريخ ورود اطلاعات
1400/09/29
عنوان به انگليسي
Investigation of classification methods in data streams
كليدواژه هاي فارسي
رده بندي , داده هاي جرياني , يادگيري ماشين , داده كاوي
كليدواژه هاي لاتين
Classification , Data Streams , Machine learning , Data mining