سوگل محمدپور

عنوان

بهبود دقت رده‌بندي تصاوير با استفاده از شبكه‌هاي همگشتي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

هوش مصنوعي

تاريخ دفاع

مهر 1395

استاد راهنما

دكتر بهروز مينايي

دانشكده

كامپيوتر

چكيده

چكيده در اين پايان‌نامه در مرحله اول با به‌كارگيري شبكه‌هاي همگشتي، مجموعه داده‌‌هاي تصويري كلتك 256رده‌بندي مي‌شود. در مرحله بعدي، فراپامترهاي مدل مورد بررسي قرار گرفته و فراپارامترهاي بهينه به منظور حصول دقت بيشينه بهدست آورده مي‌شود. شبكه ارائه شده از پنج لايه همگشتي و 3 لايه اتصال كامل تشكيل شده است. هر لايه همگشتي به نوبه خود از سه لايه همگشت، ادغام و عملگر غير خطي تشكيل شده است. در لايه انتهايي كه جزئي از لايه اتصال كامل است، به‌منظور تفكيك 256 رده مختلف از يك رده‌بند سافت‌مكس استفاده مي‌شود. در اين شبكه همگشتي به‌منظور بهبود عملكرد شبكه، مجموعه‌اي از ترفندها به‌كار گرفته مي‌شود. به‌منظور جلوگيري از اشباع نرون‌ها و در نتيجه كند شدن به‌روز رساني پارامترها، از تابع غيرخطي ReLU استفاده مي‌شود. به‌منظور جلوگيري از همساز شدن نرون‌ها و ايجاد رده‌بند تركيبي ضمني، تكنيك Dropout به‌كارگرفته مي‌شود. به‌منظور ايجاد اثر تغييرناپذيري نسبت به تغييرات، از ادغام‌هاي داراي همپوشاني استفاده مي‌شود و در نهايت به‌منظور جلوگيري از بيش برازش در يادگيري چند ميليون پارامتر اين شبكه، تكنيك ازدياد مجموعه‌داده‌ها روي مجموعه داده‌هاي محدود اعمال مي‌گردد. در عين حال اتصال لايه‌هاي همگشتي بگونه‌اي برقرار مي‌شود كه با ايجاد مسيرهاي مستقل، قابليت موازي پذيري شبكه بالا باشد. در ادامه با تغيير دادن فراپارامترهاي مدل، از قبيل ابعاد پنجره‌هاي همگشت ، تعداد لايه‌هاي همگشت، تعداد كرنل‌هاي همگشت و ميزان حذف تصادفي، نتايج تفسير شده و از آنجا فراپارامترهاي بهينه براي مجموعه داده هاي كلتك بدست آورده شده است. در نهايت با به‌كارگيري Leaky-ReLU و استفاده از شيب 15 درجه در ناحيه منفي، دقت رده‌بندي تصاوير كلتك 256 تا 78 افزايش داده شد. كليد واژه‌ها : رده‌بندي تصاوير، شبكه‌هاي همگشتي، شبكه‌هاي عميق، مجموعه داده‌هاي كَلتِك 256، تنظيم فراپارامترها

تاريخ ورود اطلاعات

1395/12/04

تاريخ بهره برداري

1/1/1900 12:00:00 AM

دانشجوي وارد كننده اطلاعات

اعظم صادقي

Name: اعظم صادقي
Author: سوگل محمدپور

چكيده به لاتين

Abstract In this thesis, in the first Caltech-256 dataset is classified using Convolutional networks and at the next step hyper-parameters of the network is optimized to get accuracy. This network consists of 5 convolutional layers 3 fully connected layers. Every Convolutional layers in turn consists of convolution, pooling and nonlinearity operation. The last layer that is one of the fully connected layes is a softmax that is used to classify the images into 256 classes. In order to improve the model, a bag of tricks have been used. The ReLU nonlinearity is used to prevent neurons to be saturated and slowing down updating the parameters. Dropout technique is used to prevent coherence effect of neurons in the same layer. In addition Dropout causes an implicit ensemble classifier to be formed. Pooling with overlapping is used to make the model invariance with respect to location. And finally data augmentation technique is used to prevent over-fitting of millions of parameters of the system. Convolutional layers are connected together so that maximum parallelizability is attained. After constructing the model various hyper parameters, such as receptive fields sizes, number of kernels, number of Convolutional layers, nonlinearity types, and dropout rate are tuned so that maximum accuracy for Caltech-256 data set is obtained. After interpretation of the results, employing slope of 0.15 in negative region of a Leaky-ReLU nonlinearity accuracy of 78 percent gained. Keywords : Image Classification, Convolutional Networks, Deep Learning, Caltech-256 Dataset, Hyper-parameter Tuning

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=16753&Field=0&DTC=6