• شماره ركورد
    16591
  • شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
    16591
  • پديد آورنده

    محمدنويد فكري

  • عنوان
    استفاده از ارتباط بين خصيصه‌ها در بهبود رده‌بندهاي مبتني بر درخت‌هاي تصميم يادگيرنده از داده‌هاي جرياني
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    هوش مصنوعي
  • تاريخ دفاع
    اسفند 1394
  • استاد راهنما
    دكتر محمدرضا كنگاوري
  • دانشكده
    كامپيوتر
  • چكيده
    با پيشرفت‌هايي كه سالهاي اخير در قدرت محاسباتي دستگاه‌هاي كامپيوتري ايجادشده است، زمينه براي ظهور هرچه بيشتر يادگيري ماشين نيز فراهم گرديد. هدف از يادگيري ماشين يك‌زمان، يافتن راه‌حل‌هاي مؤثر براي مسائل مربوط به تحليل داده‌ها بود؛ اما هم‌زمان با پيشرفت‌هاي پديدار آمده، يادگيري ماشين خود را در برابر چالش‌هاي جديدي قرارداد. يكي از مهم‌ترين اين چالش‌ها، افزايش در اندازه مجموعه داده‌هايي بود كه مي‌بايست مورد تجزيه‌وتحليل قرار مي‌گرفت. اكنون يادگيري ماشين با داده‌هايي سروكار داشت كه حجيم، پيوسته بازمان و با سرعت زياد توليد مي‌شدند و مي‌بايست روش‌هايي را معرفي مي‌كرد كه توانايي برخورد با اين داده‌ها را داشته باشد. ظهور الگوريتم‌هاي يادگيري ماشين مبتني بر داده‌هاي جرياني مقدمه‌اي بر راه‌حل‌هاي مختلفي بود كه بعد‌ها به‌عنوان الگوريتم‌هاي يادگيري داده‌هاي جرياني نام گرفت. تا به الآن روش‌هاي مختلفي براي يادگيري داده‌هاي جرياني ارائه‌شده است كه هر يك مزايا و معايب خود را دارند اما در اين ميان درخت‌هاي تصميم به‌عنوان يكي از متداول‌ترين مدل‌هاي يادگيري ماشين در نظر گرفته مي‌شود. اگرچه تا به الآن كارهاي مختلفي درزمينه‌ي بهبود الگوريتم‌هاي ساخت درخت تصميم يادگيرنده از داده‌هاي جرياني انجام‌شده است اما هنوز چالش‌هاي باز فراواني در اين زمينه وجود دارد. يكي از مهم‌ترين اين چالش‌ها بحث ناپايداري درخت‌هاي تصميم يادگيرنده مي‌باشد. در اين تحقيق سعي شده است كه با ارائه‌ي يك مدل درخت تصميم كه از ارتباط بين خصيصه‌ها كمك مي‌گيرد، اقدام به كاهش ناپايداري درخت‌هاي تصميم نماييم كه اين تلاش منجر به معرفي مدلي جديد بنام درخت صليبي (Cross Split Decision Tree كه اختصاراً CSDT ناميده مي‌شود.) گرديد. ما علاوه بر كاهش ناپايداري، موفق شديم كه بهبودهايي را نيز در زمينه اندازه درخت و عمق آن ارائه دهيم كه سبب بهبود مدل ازنظر حافظه و سرعت بازيابي نيز خواهد شد. نتايج ما نشان مي‌دهد كه نه‌تنها مدل ما ازنظر دقت قابليت رقابت با مدل‌هاي موجود فعلي را دارد؛ بلكه ازنظر ساير معيارهاي عملكردي درخت‌هاي تصميم، بهتر از مدل‌هاي فعلي عمل خواهد كرد.
  • تاريخ ورود اطلاعات
    1395/11/23
  • تاريخ بهره برداري
    1/1/1900 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    محمدنويد فكري

  • چكيده به لاتين
    In recent years, the advent of new advances in computing power of machines provided machine learning algorithms with new context in order to show their power. One time, The goal of machine learning was to find efficient solutions for data analysis but over the time, machine learning was confronted with new challenges. One of the most important challenges was increasing in size of data.Now, the data were massive an​d generating with such speed that it was imposible to store them in memory.Thereafter these types of data were named data stream. Machine Learning has to present new methods by which it can manage these data stream. Different methods have been introduced to manage them that had their pros an​d cons but among all of them, Decision trees were one of the most popular algorithm because of their high ability in representing data structures but unfortunately, Decision trees suffer from the instability problem. In this thesis we introduce Cross Split Decision Tree (CSDT) which is a new decision tree learning algorithm with improved stability. This new algorithm uses multiple attributes as the split test in the internal nodes, in spite of the classical decision tree learning algorithms which use a single attribute. The experimental results show that in comparison with the well-known decision tree learning algorithms, the proposed algorithm creates shallower an​d smaller decision trees with comparable accuracy.