-
شماره ركورد
8636
-
پديد آورنده
اميرحسين درخشان
-
عنوان
توسعه يك برنامه كاربردي جهت پاكسازي داده ها در مجموعه داده هاي تصوير
-
مقطع تحصيلي
كارشناسي
-
رشته تحصيلي
مهندسي كامپيوتر
-
سال فارغ التحصيلي
1402
-
استاد راهنما
محمدرضا محمدي
-
استاد مشاور
محمدرضا محمدي
-
دانشجوي وارد كننده اطلاعات
اميرحسين درخشان
-
تاريخ ورود اطلاعات
1402/07/04
-
دانشكده
مهندسي كامپيوتر
-
عنوان به انگليسي
Develope an application for cleaning data in image datasets
-
چكيده
يكي از نكات مهم در الگوريتم هاي يادگيري ماشين استفاده از داده هاي درست و با كيفيت جهت آموزش مدل ميباشد. داده هاي جمع آوري شده بنابر دلايل متعددي ميتوانند داراي ايرادات مختلفي باشند. يكي از ايرادات رايج و تاثير گذار، وجود داده هايي با برچسب اشتباه ميباشد. در اين پروژه سعي شده است راهكاري براي كشف چنين داده هايي ارائه شود. در راهكار ارائه شده ابتدا نياز است يك شبكه عصبي siamese روي مجموعه داده اي كه قرار است اشتباهات آن يافت شوند، جهت كشف ميزان شباهت دو داده به يكديگر، آموزش داده شود. سپس به كمك اين شبكه شبيه ترين داده هاي train به داده هاي validation كه اشتباه پيشبيني شده اند يافت شوند. در ادامه با اصلاح اين داده ها با نظارت كاربر يا انجام يك مرحله فيلتر و حذف خودكار آن ها انتظار داريم كيفيت داده ها افزايش يافته باشد و به دنبال آن مدل دقيق تري روي داده آموزش داده شود. در اين پروژه نتايج به دست آمده از اين روش با نتايج به دست آمده از الگوريتم cleanlab مقايسه شده اند. و در نهايت راهكارهايي جهت افزايش دقت راهكار پيشنهادي نيز ذكر شده است.
-
كليدواژه ها
پاكسازي داده ها , شبكه هاي عصبي مصنوعي , شبكه هاي siamese
-
لينک به اين مدرک :