• شماره ركورد
    12055
  • عنوان
    ارزيابي و بهبود الگوريتم¬هاي دسته¬بندي(naive Bayesian) با مدل map reduce براي طبقه¬بندي كلان داده
  • سال تحصيل
    1400
  • استاد راهنما
    دكتر مرضيه ملكي مجد
  • استاد مشاور
    دكتر حسن نادري
  • چکيده
    ذخيره و پردازش كلان داده¬ها در يك دستگاه عملا غيرممكن است. در نتيجه، تقاضا براي پردازش سريعتر داده¬هاي بزرگ روز به روز در حال افزايش است و بسياري از محققان بر موازي سازي فرآيندها به منظور افزايش سرعت الگوريتم¬ها تمركز كرده اند. شايان ذكر است كه علاوه بر موازي سازي راه حل، الگوريتم¬ها و روش¬ها نيز بايد براي مقابله با مشكل داده¬هاي بزرگ اصلاح شوند. كلان داده شامل جمع آوري داده¬ها از زمينه¬هاي مختلف است و استفاده از الگوريتم طبقه¬بندي مشكلات داده كاوي را در داده¬هاي بزرگ حل مي¬كند. ايده اصلي پشت كار طبقه¬بندي، ساختن مدلي (طبقه¬بندي كننده) است كه داده¬ها را با هدف پيش¬بيني دقيق كلاس هدف براي هر آيتم در داده¬ها طبقه¬بندي مي¬كند. تكنيك‌هاي زيادي مانند درخت‌هاي تصميم، شبكه‌هاي بيز، الگوريتم‌هاي ژنتيك، برنامه‌ريزي ژنتيك و غيره براي انطباق با طبقه‌بندي داده‌هاي بزرگ وجود دارد. بهبود موقعيت داده‌ها مي‌تواند ترافيك شبكه را با انتقال وظايف، كاهش دهد. انحراف داده ها منجر به عدم تعادل بار در گره¬هاي كاهنده مي¬شود. پارتيشن بندي يك عمليات مهم MapReduce است زيرا مقصد خروجي نقشه را تعيين مي¬كند و مي¬تواند به طور قابل توجهي بر مقدار داده¬هاي درهم ريختگي تأثير بگذارد. بنابراين، يك دسته¬بند مؤثر مي‌تواند عملكرد MapReduce را با افزايش موقعيت داده‌ها و كاهش انحراف داده‌ها ، بهبود بخشد. مطالعات قبلي با در نظر گرفتن دو موضوع اساسي اين واقعيت را ناديده گرفته¬اند كه براي انواع مختلف فرآيندها، اولويت محل داده¬ها و انحراف داده¬ها ممكن است اثرات متفاوتي بر زمان اجرا داشته باشد. در اين راستا، محققان يك رويكرد طبقه¬بندي جديد مبتني بر يادگيري ماشين ساده بيز، پيشنهاد كرده¬اند كه از طريق بهينه‌سازي موقعيت داده‌ها و چولگي داده‌ها با اعمال نفوذ طبقه‌بندي‌كننده ساده بيز، به عنوان مثال، در نظر گرفتن نوع كار و پهناي باند به عنوان ويژگي‌هاي طبقه‌بندي، عملكرد بهتري را به دست مي‌آورد. نوآوري اين پژوهش ارزيابي و بهبود الگوريتم¬هاي دسته-بندي(naive Bayesian) با مدل map reduce براي طبقه بندي كلان داده است.
  • نام دانشجو

    سارا عسگري

  • تاريخ ارائه
    5/10/2023 12:00:00 AM
  • متن كامل
    79047
  • پديد آورنده

    سارا عسگري

  • تاريخ ورود اطلاعات
    1402/03/31
  • عنوان به انگليسي
    eva‎luation and improvement of classification algorithms (naive Bayesian) with map reduce model for big data classification
  • كليدواژه هاي فارسي
    پردازش كلان داده , طبقه بندي كلان داده , الگوريتم هاي طبقه بندي , الگوريتم naïve Bayesian.
  • كليدواژه هاي لاتين
    Big data processing , Classification of big data , Classification algorithms , Naïve Bayesian Algorithm.