شماره ركورد
16591
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
16591
پديد آورنده
محمدنويد فكري
عنوان
استفاده از ارتباط بين خصيصهها در بهبود ردهبندهاي مبتني بر درختهاي تصميم يادگيرنده از دادههاي جرياني
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
هوش مصنوعي
تاريخ دفاع
اسفند 1394
استاد راهنما
دكتر محمدرضا كنگاوري
دانشكده
كامپيوتر
چكيده
با پيشرفتهايي كه سالهاي اخير در قدرت محاسباتي دستگاههاي كامپيوتري ايجادشده است، زمينه براي ظهور هرچه بيشتر يادگيري ماشين نيز فراهم گرديد. هدف از يادگيري ماشين يكزمان، يافتن راهحلهاي مؤثر براي مسائل مربوط به تحليل دادهها بود؛ اما همزمان با پيشرفتهاي پديدار آمده، يادگيري ماشين خود را در برابر چالشهاي جديدي قرارداد. يكي از مهمترين اين چالشها، افزايش در اندازه مجموعه دادههايي بود كه ميبايست مورد تجزيهوتحليل قرار ميگرفت. اكنون يادگيري ماشين با دادههايي سروكار داشت كه حجيم، پيوسته بازمان و با سرعت زياد توليد ميشدند و ميبايست روشهايي را معرفي ميكرد كه توانايي برخورد با اين دادهها را داشته باشد. ظهور الگوريتمهاي يادگيري ماشين مبتني بر دادههاي جرياني مقدمهاي بر راهحلهاي مختلفي بود كه بعدها بهعنوان الگوريتمهاي يادگيري دادههاي جرياني نام گرفت. تا به الآن روشهاي مختلفي براي يادگيري دادههاي جرياني ارائهشده است كه هر يك مزايا و معايب خود را دارند اما در اين ميان درختهاي تصميم بهعنوان يكي از متداولترين مدلهاي يادگيري ماشين در نظر گرفته ميشود.
اگرچه تا به الآن كارهاي مختلفي درزمينهي بهبود الگوريتمهاي ساخت درخت تصميم يادگيرنده از دادههاي جرياني انجامشده است اما هنوز چالشهاي باز فراواني در اين زمينه وجود دارد. يكي از مهمترين اين چالشها بحث ناپايداري درختهاي تصميم يادگيرنده ميباشد. در اين تحقيق سعي شده است كه با ارائهي يك مدل درخت تصميم كه از ارتباط بين خصيصهها كمك ميگيرد، اقدام به كاهش ناپايداري درختهاي تصميم نماييم كه اين تلاش منجر به معرفي مدلي جديد بنام درخت صليبي (Cross Split Decision Tree كه اختصاراً CSDT ناميده ميشود.) گرديد. ما علاوه بر كاهش ناپايداري، موفق شديم كه بهبودهايي را نيز در زمينه اندازه درخت و عمق آن ارائه دهيم كه سبب بهبود مدل ازنظر حافظه و سرعت بازيابي نيز خواهد شد. نتايج ما نشان ميدهد كه نهتنها مدل ما ازنظر دقت قابليت رقابت با مدلهاي موجود فعلي را دارد؛ بلكه ازنظر ساير معيارهاي عملكردي درختهاي تصميم، بهتر از مدلهاي فعلي عمل خواهد كرد.
تاريخ ورود اطلاعات
1395/11/23
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محمدنويد فكري
چكيده به لاتين
In recent years, the advent of new advances in computing power of machines provided machine learning algorithms with new context in order to show their power. One time, The goal of machine learning was to find efficient solutions for data analysis but over the time, machine learning was confronted with new challenges. One of the most important challenges was increasing in size of data.Now, the data were massive and generating with such speed that it was imposible to store them in memory.Thereafter these types of data were named data stream. Machine Learning has to present new methods by which it can manage these data stream. Different methods have been introduced to manage them that had their pros and cons but among all of them, Decision trees were one of the most popular algorithm because of their high ability in representing data structures but unfortunately, Decision trees suffer from the instability problem. In this thesis we introduce Cross Split Decision Tree (CSDT) which is a new decision tree learning algorithm with improved stability. This new algorithm uses multiple attributes as the split test in the internal nodes, in spite of the classical decision tree learning algorithms which use a single attribute. The experimental results show that in comparison with the well-known decision tree learning algorithms, the proposed algorithm creates shallower and smaller decision trees with comparable accuracy.