شماره ركورد
34038
پديد آورنده
سيدمهدي شريعت زاده
عنوان
جستجوي معماري عصبي كارآمد در شبكههاي عصبي پيچشي عميق براي كاربردهاي بينايي ماشيني
مقطع تحصيلي
دكترا
رشته تحصيلي
مهندسي كامپيوتر
سال تحصيل
1394
تاريخ دفاع
1403/06/28
استاد راهنما
دكتر محمود فتحي
استاد مشاور
دكتر رضا برنگي
دانشكده
مهندسي كامپيوتر
چكيده
با گسترش روزافزون شبكههاي عصبي عميق در حوزههاي هوش مصنوعي و پردازش سيگنال، طراحي دستي معماري شبكههاي عصبي پيچشي -از تعداد ابرمولفه¬هايي مانند تعداد و نوع لايهها و اندازه هسته پيچش تا پهناي كانالها و نوع اتصالات- به يكي از چالشهاي اصلي و پرهزينه بدل شده است. رويكردهاي موجود در انتخاب معماري اغلب تكهدفه بوده و قادر به در نظر گرفتن همزمان شاخصهاي متعارض (مانند دقت، زمان اجرا، مصرف حافظه و پيچيدگي محاسباتي) نيستند و اين امر منجر به معماريهاي كمتر بهينه و اتلاف منابع ميشود.
اين رساله رويكردي خودكار و چندهدفه براي جستجوي معماري شبكههاي عصبي(NAS) ارائه ميكند كه بهطور همزمان چندين معيار كليدي عملكرد را بهينهسازي مينمايد. در اين روش، ابتدا فضاي معماري/ويژگي و همچنين هدف هاي بهينه سازي تعريف شده و سپس با استفاده از تركيب الگوريتمهاي تكاملي مبتني بر ژنتيك و جستجوي تكراري/محلي، كاوش هدايتشده فضاي معماري ها انجام ميشود. براي كاهش هزينه محاسباتي، از روش هاي تك¬شات بهره گرفته شده تا امكان جستجوي مؤثر در مقياس بزرگ فراهم گردد. در ادامه با استفاده از تحليل پارتو، راهحلهاي بهينه پارتو (مرز پارتو) استخراج شده و نهايتا معماريهاي مناسب شناسايي ميشود.
نتايج تجربي نشان ميدهد كه روش پيشنهادي ضمن كاهش چشمگير هزينه محاسباتي، قادر به توليد معماريهاي كارآمد است كه بهطور همزمان دقت بالا، مصرف بهينه منابع و سرعت پردازش مناسب را تأمين ميكنند. اين دستاورد ميتواند بهعنوان يك چارچوب قابل اعتماد در مسائل متنوع يادگيري ماشين و پردازش علائم بهكار گرفته شود و مبنايي براي پژوهشهاي آتي در بهينهسازي چندهدفه معماري شبكههاي عصبي فراهم آورد.
تاريخ ورود اطلاعات
1404/07/30
عنوان به انگليسي
Efficient Neural Architecture Search In Convolutional Networks for Computer Vision Applications
تاريخ بهره برداري
9/18/2024 12:00:00 AM
دانشجوي وارد كننده اطلاعات
سيدمهدي شريعت زاده
چكيده به لاتين
In the field of artificial intelligence, deep learning models and, in particular, deep convolutional neural networks are one of the drivers of signal processing and data processing. Neural architecture search or NAS is an automatic solution to optimize and solve some problems of neural networks, which is the main topic of this thesis.
The main goal of this thesis is to investigate and present a method for automatically finding optimal architectures of deep convolutional neural networks for machine vision from aspects such as accuracy, computational complexity and the amount of memory consumed. For this purpose, we use multi-objective neural architecture search and single-shot methods, which are among the lightest methods proposed for neural architecture search. First, by conducting neural architecture search based on methods such as local iterative search and genetic algorithm, we identify and extract some features of the basic search space. In the following, we will use a one-shot method (which is the least expensive neural architecture search method) in order to find a suitable architecture. This whole process is done by considering multi-objective optimization and Pareto set of found answers. Finally, we provide solutions to improve the NAS process in a multi-objective manner in the industrial application problems of machine vision. Operational experiences show the effectiveness of the proposed method and its efficiency in solving machine vision problems.
كليدواژه هاي فارسي
يادگيري عميق , شبكه هاي عصبي پيچشي , جستجوي معماري عصبي , بهينه سازي چندهدفه , پردازش تصوير , بينايي رايانه اي
كليدواژه هاي لاتين
Deep learning , convolutional neuran networks , multiobjective optimization , image processing , computer vision
Author
Seyed Mahdi Shariatzadeh
SuperVisor
Mahmood Fathy