شماره ركورد
14100
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
14100
پديد آورنده
سيدامير مهديان
عنوان
الگوريتم طبقه بندي جريان هاي داده ي مفهوم متغير
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
نرم افزار
سال تحصيل
بهمن ماه 1393
تاريخ دفاع
بهمن ماه 1393
استاد راهنما
دكتر عين الله خنجري
دانشكده
كامپيوتر
چكيده
چكيده
در سال¬هاي¬اخير پيشرفت¬هاي سريع تكنولوژي¬هاي سخت¬افزاري و توسعه برنامه¬هاي كاربردي مانند برنامه-هاي كنترل ترافيك شبكه، مديريت تراكنش¬هاي ATM، مكالمات تلفني، تجهيزات دريافت سيگنال¬هاي كنترلي در صنعت، مانيتورينگ صوتي و تصويري، كنترل پرتابه¬ها، حسگر¬هاي هواشناسي و رادارهاي نظامي باعث شده¬اند تا بشر با حجم عظيمي از داده¬ مواجه باشد. همراه شدن اين پيشرفت¬ها با فراگير شدن اينترنت سبب توجه بيشتر به موضوع جريان¬هاي داده شده¬ است. به داده¬هايي كه به صورت پيوسته با سرعت زياد، حجم نامحدود و پويا توليد مي¬شوند جريان¬هاي داده گفته مي¬شود. به دليل خصوصيات متفاوت جريان¬هاي داده مانند عدم امكان ذخيره¬سازي، عدم امكان دسترسي هر ركورد بيش از يك¬بار(به دليل عدم ذخيره كردن) و تغيير ماهيت و مفهوم داده با گذشت زمان كاوش اين داده¬ها با روش¬هاي سنتي داده¬كاوي امكان¬پذير نيست. طبقه¬بندي جريان¬هاي داده يكي از مهمترين مسائل مورد مطالعه و تحقيق در اين حوزه بوده و هست. در سال¬هاي اخير تكنيك¬ها و روش¬هايي كه از يادگيري افزايشي براي طبقه¬بندي جريان¬هاي داده استفاده مي¬كنند، به طور گسترده¬اي مورد مطالعه و استفاده قرار گرفته-اند.مهمترين مزيت اين روش¬ها حل مسأله¬ي تغيير مفهوم است. دو چالش¬ اصلي روش¬هاي يادگيري افزايشي، زمان بالا و محاسبات پيچيده براي بروزرساني مدل با ورود داده جديد و همچنين نسبت مستقيم ميزان حافظه در دسترس براي نگهداري مدل ايجاد شده با دقت طبقه¬بندي كننده است. در اين پايان نامه با استفاده از قوانين احتمالات و استفاده ¬از روش شمارش اتلافي الگوهاي مكرر براي طبقه¬بندي جريان-هاي داده¬ي مفهوم متغير ارائه شده است. اين روش داراي زمان ساخت و بروزرساني پايين و حافظه مورد نياز حداقلي و قابل مديريت است. پياده¬سازي، ارزيابي و مقايسه روش مذكور با روش¬هاي شناخته شده موجود نشان مي¬دهد كه اين روش از لحاظ دقت، زمان ساخت و بروزرساني مدل و حافظه مورد نياز در مجموع بهتر از روش¬هاي شناخته شده موجود است.
واژههاي كليدي:داده¬كاوي-جريان¬هاي داده- طبقه¬بندي- يادگيري افزايشي- تغيير مفهوم.