شماره ركورد
12055
عنوان
ارزيابي و بهبود الگوريتم¬هاي دسته¬بندي(naive Bayesian) با مدل map reduce براي طبقه¬بندي كلان داده
سال تحصيل
1400
استاد راهنما
دكتر مرضيه ملكي مجد
استاد مشاور
دكتر حسن نادري
چکيده
ذخيره و پردازش كلان داده¬ها در يك دستگاه عملا غيرممكن است. در نتيجه، تقاضا براي پردازش سريعتر داده¬هاي بزرگ روز به روز در حال افزايش است و بسياري از محققان بر موازي سازي فرآيندها به منظور افزايش سرعت الگوريتم¬ها تمركز كرده اند. شايان ذكر است كه علاوه بر موازي سازي راه حل، الگوريتم¬ها و روش¬ها نيز بايد براي مقابله با مشكل داده¬هاي بزرگ اصلاح شوند. كلان داده شامل جمع آوري داده¬ها از زمينه¬هاي مختلف است و استفاده از الگوريتم طبقه¬بندي مشكلات داده كاوي را در داده¬هاي بزرگ حل مي¬كند. ايده اصلي پشت كار طبقه¬بندي، ساختن مدلي (طبقه¬بندي كننده) است كه داده¬ها را با هدف پيش¬بيني دقيق كلاس هدف براي هر آيتم در داده¬ها طبقه¬بندي مي¬كند. تكنيكهاي زيادي مانند درختهاي تصميم، شبكههاي بيز، الگوريتمهاي ژنتيك، برنامهريزي ژنتيك و غيره براي انطباق با طبقهبندي دادههاي بزرگ وجود دارد.
بهبود موقعيت دادهها ميتواند ترافيك شبكه را با انتقال وظايف، كاهش دهد. انحراف داده ها منجر به عدم تعادل بار در گره¬هاي كاهنده مي¬شود. پارتيشن بندي يك عمليات مهم MapReduce است زيرا مقصد خروجي نقشه را تعيين مي¬كند و مي¬تواند به طور قابل توجهي بر مقدار داده¬هاي درهم ريختگي تأثير بگذارد. بنابراين، يك دسته¬بند مؤثر ميتواند عملكرد MapReduce را با افزايش موقعيت دادهها و كاهش انحراف دادهها ، بهبود بخشد. مطالعات قبلي با در نظر گرفتن دو موضوع اساسي اين واقعيت را ناديده گرفته¬اند كه براي انواع مختلف فرآيندها، اولويت محل داده¬ها و انحراف داده¬ها ممكن است اثرات متفاوتي بر زمان اجرا داشته باشد. در اين راستا، محققان يك رويكرد طبقه¬بندي جديد مبتني بر يادگيري ماشين ساده بيز، پيشنهاد كرده¬اند كه از طريق بهينهسازي موقعيت دادهها و چولگي دادهها با اعمال نفوذ طبقهبنديكننده ساده بيز، به عنوان مثال، در نظر گرفتن نوع كار و پهناي باند به عنوان ويژگيهاي طبقهبندي، عملكرد بهتري را به دست ميآورد. نوآوري اين پژوهش ارزيابي و بهبود الگوريتم¬هاي دسته-بندي(naive Bayesian) با مدل map reduce براي طبقه بندي كلان داده است.
نام دانشجو
سارا عسگري
تاريخ ارائه
5/10/2023 12:00:00 AM
متن كامل
79047
پديد آورنده
سارا عسگري
تاريخ ورود اطلاعات
1402/03/31
عنوان به انگليسي
evaluation and improvement of classification algorithms (naive Bayesian) with map reduce model for big data classification
كليدواژه هاي فارسي
پردازش كلان داده , طبقه بندي كلان داده , الگوريتم هاي طبقه بندي , الگوريتم naïve Bayesian.
كليدواژه هاي لاتين
Big data processing , Classification of big data , Classification algorithms , Naïve Bayesian Algorithm.