شماره ركورد
16753
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
16753
پديد آورنده
سوگل محمدپور
عنوان
بهبود دقت ردهبندي تصاوير با استفاده از شبكههاي همگشتي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
هوش مصنوعي
تاريخ دفاع
مهر 1395
استاد راهنما
دكتر بهروز مينايي
دانشكده
كامپيوتر
چكيده
چكيده
در اين پاياننامه در مرحله اول با بهكارگيري شبكههاي همگشتي، مجموعه دادههاي تصويري كلتك 256ردهبندي ميشود. در مرحله بعدي، فراپامترهاي مدل مورد بررسي قرار گرفته و فراپارامترهاي بهينه به منظور حصول دقت بيشينه بهدست آورده ميشود. شبكه ارائه شده از پنج لايه همگشتي و 3 لايه اتصال كامل تشكيل شده است. هر لايه همگشتي به نوبه خود از سه لايه همگشت، ادغام و عملگر غير خطي تشكيل شده است. در لايه انتهايي كه جزئي از لايه اتصال كامل است، بهمنظور تفكيك 256 رده مختلف از يك ردهبند سافتمكس استفاده ميشود. در اين شبكه همگشتي بهمنظور بهبود عملكرد شبكه، مجموعهاي از ترفندها بهكار گرفته ميشود. بهمنظور جلوگيري از اشباع نرونها و در نتيجه كند شدن بهروز رساني پارامترها، از تابع غيرخطي ReLU استفاده ميشود. بهمنظور جلوگيري از همساز شدن نرونها و ايجاد ردهبند تركيبي ضمني، تكنيك Dropout بهكارگرفته ميشود. بهمنظور ايجاد اثر تغييرناپذيري نسبت به تغييرات، از ادغامهاي داراي همپوشاني استفاده ميشود و در نهايت بهمنظور جلوگيري از بيش برازش در يادگيري چند ميليون پارامتر اين شبكه، تكنيك ازدياد مجموعهدادهها روي مجموعه دادههاي محدود اعمال ميگردد. در عين حال اتصال لايههاي همگشتي بگونهاي برقرار ميشود كه با ايجاد مسيرهاي مستقل، قابليت موازي پذيري شبكه بالا باشد. در ادامه با تغيير دادن فراپارامترهاي مدل، از قبيل ابعاد پنجرههاي همگشت ، تعداد لايههاي همگشت، تعداد كرنلهاي همگشت و ميزان حذف تصادفي، نتايج تفسير شده و از آنجا فراپارامترهاي بهينه براي مجموعه داده هاي كلتك بدست آورده شده است. در نهايت با بهكارگيري Leaky-ReLU و استفاده از شيب 15 درجه در ناحيه منفي، دقت ردهبندي تصاوير كلتك 256 تا 78 افزايش داده شد.
كليد واژهها : ردهبندي تصاوير، شبكههاي همگشتي، شبكههاي عميق، مجموعه دادههاي كَلتِك 256، تنظيم فراپارامترها
تاريخ ورود اطلاعات
1395/12/04
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
اعظم صادقي
چكيده به لاتين
Abstract
In this thesis, in the first Caltech-256 dataset is classified using Convolutional networks and at the next step hyper-parameters of the network is optimized to get accuracy. This network consists of 5 convolutional layers 3 fully connected layers. Every Convolutional layers in turn consists of convolution, pooling and nonlinearity operation. The last layer that is one of the fully connected layes is a softmax that is used to classify the images into 256 classes. In order to improve the model, a bag of tricks have been used. The ReLU nonlinearity is used to prevent neurons to be saturated and slowing down updating the parameters. Dropout technique is used to prevent coherence effect of neurons in the same layer. In addition Dropout causes an implicit ensemble classifier to be formed. Pooling with overlapping is used to make the model invariance with respect to location. And finally data augmentation technique is used to prevent over-fitting of millions of parameters of the system. Convolutional layers are connected together so that maximum parallelizability is attained. After constructing the model various hyper parameters, such as receptive fields sizes, number of kernels, number of Convolutional layers, nonlinearity types, and dropout rate are tuned so that maximum accuracy for Caltech-256 data set is obtained. After interpretation of the results, employing slope of 0.15 in negative region of a Leaky-ReLU nonlinearity accuracy of 78 percent gained.
Keywords : Image Classification, Convolutional Networks, Deep Learning, Caltech-256 Dataset, Hyper-parameter Tuning