-
شماره ركورد
31186
-
پديد آورنده
نرگس سميرمي زاده
-
عنوان
شناسايي نوع و مدل وسيله نقليه با استفاده از يادگيري عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق-سيستم هاي الكترونيك ديجيتال
-
سال تحصيل
1400
-
تاريخ دفاع
1403/3/19
-
استاد راهنما
شهريار برادران شكوهي- ستار ميرزاكوچكي
-
استاد مشاور
ندارد
-
دانشكده
مهندسي برق
-
چكيده
شناسايي برند و مدل وسيله نقليه جزء مهمي از سيستم حمل و نقل هوشمند است كه در سالهاي اخير توجه زيادي را به خود جلب كرده است. VMMR مي تواند به طور گسترده در شناسايي خودروهاي مشكوك، نظارت بر ترافيك شهري و سيستم رانندگي خودكار استفاده شود. VMMR به دليل تفاوت هاي ظاهري جزئي بين مدل هاي مختلف خودرو، پيچيده است. شبكه هاي عصبي كانولوشني به عنوان يكي از انواع مدل هاي يادگيري عميق، امروزه به طور گسترده در انواع كارهاي مرتبط با بينايي كامپيوتر استفاده مي شوند و به نتايج قابل توجهي دست يافته اند كه يكي از آنها VMMR است. هم چنين مطالعات انجام شده نشان مي دهند كه مكانيزم توجه به عنوان ابزاري قدرتمند براي بهبود عملكرد در بسياري از كاربردهاي بينايي كامپيوتري مبتني بر يادگيري عميق است و به كارگيري آن در CNNها نيز موجب افزايش قدرت بازنمايي و بهبود عملكرد آن ها در كارهاي دستهبندي در مقياس بزرگ مي شود. از آن جايي كه VMMR يك دسته بندي دقيق محسوب مي شود، عمدتا با دو مشكل روبه رو است: اول، شباهت بين كلاسي و تنوع درون كلاسي و دوم، مقدار محدودي از داده هاي آموزشي.
در اين كار براي كاهش اثر منفي ناشي از مشكل اول، از يك ماژول توجه كه وزنهاي توجه سه بعدي را براي اصلاح نقشه ويژگي در يك لايه، بدون افزودن پارامتر به مدل اصلي، توليد ميكند به منظور كمك به تمركز مدل بر مناطق مهم و حاوي سرنخ هاي متمايز، استفاده شده است و تكنيك داده افزايي براي حل مشكل كمبود داده هاي آموزشي به كار گرفته شده است. در اين كار براي تعيين محل موثر جايگذاري ماژول توجه در مدل كانولوشني آزمايش هايي انجام شد. بر اساس نتايج به دست آمده از اين آزمايش ها، مدل پيشنهادي از قرار داده شدن ماژول توجه مورد نظر در دو مكان مختلف از بخش مياني مدل كانولوشني كه نقشه ويژگي به دست آمده از آن دو قسمت حاوي ميزان اطلاعات مناسبي از فريم هاي ورودي (نه خيلي جزئي و نه خيلي خام) مي باشد، حاصل شد. نتايج حاصل از عملكرد مدل پيشنهادي با 10 مدل مشهور ديگر مورد مقايسه گرفت و مدل پيشنهادي توانست بر روي مجموعه داده Stanford Cars به بالاترين دقت يعني 90.69% در بين مدل هاي مورد مقايسه دست پيدا كند در حالي كه از نظر تعداد پارامتر و پيچيدگي محاسباتي نيز بهينه مي باشد.
-
تاريخ ورود اطلاعات
1403/06/26
-
عنوان به انگليسي
Vehicle Make and Model Recognition Using Deep Learning
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
نرگس سميرمي زاده
-
چكيده به لاتين
Vehicle make and model recognition (VMMR) is an important component of the Intelligent Transport System (ITS), which has attracted a lot of attention in recent years. VMMR can be widely used in suspicious vehicle recognition, urban traffic monitoring, and the automated driving system. VMMR is complicated due to the subtle visual differences among vehicle models. As one type of deep learning models, the Convolutional Neural Networks (CNNs) are being widely used nowadays in a variety of computer vision tasks; one of which is the VMMR. Also, the studies show that the attention mechanism is a powerful tool for improving performance in many computer vision applications based on deep learning, and its use in CNNs also increases the power of representation and improves their performance in large-scale classification tasks. Since VMMR is considered a fine-grained classification, it mainly faces two problems: first, inter-class similarity and intra-class variation, and second, limited amount of training data.
In this work, to reduce the negative effect caused by the first problem, an attention module that generates 3D attention weights to modify the feature map in a layer, without adding parameters to the original model, has been used to help the model focus on important and containing discriminative clues areas, and data augmentation technique has been used to solve the problem of lack of training data. In this work, experiments were conducted to determine the effective placement of the attention module in the convolutional model. Based on the results obtained from these experiments, the proposed model was obtained by placing the desired attention module in two different places of the middle part of the convolution model, where the feature map obtained from those two parts contains adequate information from the input frames (not too detailed and not too raw). The performance results of the proposed model were compared with 10 other well-known models and the proposed model was able to achieve the highest accuracy of 90.69% among the compared models on the Stanford Cars dataset, while it is also optimal in terms of the number of parameters and computational complexity.
-
كليدواژه هاي فارسي
سيستم حمل و نقل هوشمند , شناسايي برند و مدل وسيله نقليه , دسته بندي دقيق , شبكه عصبي كانولوشني , توجه
-
كليدواژه هاي لاتين
intelligent transportation system , vehicle make and model recognition , fine-grained classification , convolutional neural network , attention
-
Author
Narges Semiromizadeh
-
SuperVisor
Dr. Shahriar Baradaran Shokouhi- Sattar Mirzakuchaki
-
لينک به اين مدرک :