شماره ركورد
13526
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
13526
پديد آورنده
بهزاد مخنفي
عنوان
طراحي الگوريتمي جهت يادگيري مجمع مجمع درخت تصميم از داده هاي جرياني
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كامپيوتر - هوش مصنوعي
سال تحصيل
ارديبهشت 1393
تاريخ دفاع
ارديبهشت 1393
استاد راهنما
دكتر محمدرضا كنگاوري
چكيده
چكيده
داده¬كاوي داده¬هاي جرياني كه معمولا با تغيير مفهوم همراه هستند يكي از مهم¬ترين موضوعات مورد علاقه محققان در زمينه يادگيري ماشين و داده¬كاوي در سال¬هاي اخير بوده است. از بهترين روش¬هايي كه در اين زمينه مي توانند به خوبي با تغيير مفهوم مقابله كنند، رده¬بند¬¬هاي چندتايي يا مجمع¬رده¬بند هستند. در سال¬هاي اخير، تحقيقات زيادي در مورد مجمع رده¬بند انجام شده و مدل¬هاي موفقي نيز بر مبناي اين نوع يادگيري براي رده¬بندي داده¬هاي جرياني ارائه شده است. با وجود دستاوردهاي زيادي كه اين مدل¬ها داشته¬اند هنوز برخي مشكلات باقي مانده است، مشكلاتي از جمله عدم وفق¬پذيري سريع در برابر تغيير مفهوم سريع و ناگهاني و عدم كارايي در برابر تغيير مفهوم دوره¬اي.
در اين پايان¬نامه الگوريتمي براي رده¬بندي داده¬هاي جرياني طراحي شده است كه آن را مجمع مجمع درخت¬هاي تصميم نام¬گذاري كرديم. الگوريتم با ساخت درخت¬هاي تصميم سريع روي گروه¬هاي داده¬ و خوشه¬بندي درخت¬هاي ساخته شده بر اساس آنتروپي داده¬هاي آموزش ديده شده مدل مجمع مجمع درخت را توليد مي¬كند.
در مرحله ساخت درخت¬ها، با محاسبه دقت تك¬تك درخت¬هاي ساخته شده و اختصاص وزن¬ به هريك از آن¬ها براي شركت در راي¬گيري نهايي و همچنين محاسبه دقت كل مجمع براي اختصاص وزن¬هاي هر يك از درخت¬ها و همچنين وزن¬هاي هر يك از مجمع¬ها در راي¬گيري نهايي سعي كرده¬ايم دقت نهايي را پايدار نگاه داريم تا در صورت بروز تغيير مفهوم دقت كلي افت زياد پيدا نكرده و هر چه سريع تر بتواند دقت خود را با مفهوم جديد بروز كند و بتواند در هر لحظه معرف¬ترين مدل براي داده¬هاي كنوني باشد.
به عنوان معيار شباهت در خوشه¬بندي درخت¬ها، از اختلاف آنتروپي گروه¬هاي داده هر يك استفاده كرديم. به اين معني كه اگر اختلاف قابل ملاحظه¬اي در توزيع دو گروه داده¬ موجود باشد، آنتروپي دو گروه نيز اختلاف قابل ملاحظه¬اي خواهد داشت و به دنبال آن هرچه آنتروپي¬ها دورتر ازهم باشند مفاهيم دورتر هستند.
براي ارزيابي الگوريتم، دو گروه از داده¬هاي UCI را انتخاب كرده و با اعمال تغيير مفهوم¬هاي ناگهاني و سريع روي داده¬ها در چند مرحله به صورت رندوم، الگوريتم را روي آن¬ها مورد ارزيابي قرار داده و با نتايج حاصله از تعدادي از الگوريتم¬هاي شناخته شده رده¬بندي داده¬هاي جرياني كه بر اساس مجمع رده-بندها هستند، از نظر دقت و زمان اجرا مقايسه كرده و به نتايج قابل قبول و اميدواركننده¬اي رسيديم.
واژههاي كليدي:رده¬بندي داده¬هاي جرياني ، مجمع مجمع ، يادگيري تغيير مفهوم ، درخت تصميم، خوشه بندي.