-
شماره ركورد
13526
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
13526
-
پديد آورنده
بهزاد مخنفي
-
عنوان
طراحي الگوريتمي جهت يادگيري مجمع مجمع درخت تصميم از داده هاي جرياني
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي
-
سال تحصيل
ارديبهشت 1393
-
تاريخ دفاع
ارديبهشت 1393
-
استاد راهنما
دكتر محمدرضا كنگاوري
-
چكيده
چكيده
داده¬كاوي داده¬هاي جرياني كه معمولا با تغيير مفهوم همراه هستند يكي از مهم¬ترين موضوعات مورد علاقه محققان در زمينه يادگيري ماشين و داده¬كاوي در سال¬هاي اخير بوده است. از بهترين روش¬هايي كه در اين زمينه مي توانند به خوبي با تغيير مفهوم مقابله كنند، رده¬بند¬¬هاي چندتايي يا مجمع¬رده¬بند هستند. در سال¬هاي اخير، تحقيقات زيادي در مورد مجمع رده¬بند انجام شده و مدل¬هاي موفقي نيز بر مبناي اين نوع يادگيري براي رده¬بندي داده¬هاي جرياني ارائه شده است. با وجود دستاوردهاي زيادي كه اين مدل¬ها داشته¬اند هنوز برخي مشكلات باقي مانده است، مشكلاتي از جمله عدم وفق¬پذيري سريع در برابر تغيير مفهوم سريع و ناگهاني و عدم كارايي در برابر تغيير مفهوم دوره¬اي.
در اين پايان¬نامه الگوريتمي براي رده¬بندي داده¬هاي جرياني طراحي شده است كه آن را مجمع مجمع درخت¬هاي تصميم نام¬گذاري كرديم. الگوريتم با ساخت درخت¬هاي تصميم سريع روي گروه¬هاي داده¬ و خوشه¬بندي درخت¬هاي ساخته شده بر اساس آنتروپي داده¬هاي آموزش ديده شده مدل مجمع مجمع درخت را توليد مي¬كند.
در مرحله ساخت درخت¬ها، با محاسبه دقت تك¬تك درخت¬هاي ساخته شده و اختصاص وزن¬ به هريك از آن¬ها براي شركت در راي¬گيري نهايي و همچنين محاسبه دقت كل مجمع براي اختصاص وزن¬هاي هر يك از درخت¬ها و همچنين وزن¬هاي هر يك از مجمع¬ها در راي¬گيري نهايي سعي كرده¬ايم دقت نهايي را پايدار نگاه داريم تا در صورت بروز تغيير مفهوم دقت كلي افت زياد پيدا نكرده و هر چه سريع تر بتواند دقت خود را با مفهوم جديد بروز كند و بتواند در هر لحظه معرف¬ترين مدل براي داده¬هاي كنوني باشد.
به عنوان معيار شباهت در خوشه¬بندي درخت¬ها، از اختلاف آنتروپي گروه¬هاي داده هر يك استفاده كرديم. به اين معني كه اگر اختلاف قابل ملاحظه¬اي در توزيع دو گروه داده¬ موجود باشد، آنتروپي دو گروه نيز اختلاف قابل ملاحظه¬اي خواهد داشت و به دنبال آن هرچه آنتروپي¬ها دورتر ازهم باشند مفاهيم دورتر هستند.
براي ارزيابي الگوريتم، دو گروه از داده¬هاي UCI را انتخاب كرده و با اعمال تغيير مفهوم¬هاي ناگهاني و سريع روي داده¬ها در چند مرحله به صورت رندوم، الگوريتم را روي آن¬ها مورد ارزيابي قرار داده و با نتايج حاصله از تعدادي از الگوريتم¬هاي شناخته شده رده¬بندي داده¬هاي جرياني كه بر اساس مجمع رده-بندها هستند، از نظر دقت و زمان اجرا مقايسه كرده و به نتايج قابل قبول و اميدواركننده¬اي رسيديم.
واژههاي كليدي:رده¬بندي داده¬هاي جرياني ، مجمع مجمع ، يادگيري تغيير مفهوم ، درخت تصميم، خوشه بندي.
-
لينک به اين مدرک :