سارا شهسواراني

شماره ركورد
18595
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
۱۸۵۹۵
پديد آورنده
سارا شهسواراني
عنوان
ارائه روشي براي شناسايي چهره چندديدي با استفاده از شبكه هاي عصبي عميق
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
هوش مصنوعي
تاريخ دفاع
بهمن ۱۳۹۶
استاد راهنما
دكتر مرتضي آنالويي
دانشكده
كامپيوتر
چكيده
يادگيري عميق را مي توان فصلي نو در حوزه يادگيري ماشين دانست. شبكه هاي عصبي عميق يا همان يادگيري عميق سبب پيشرفت شگرفي در زمينه هاي مختلف از جمله پردازش تصوير و بينايي ماشين شده اند. نتايج به دست آمده از سامانه هاي شناسايي چهره مبتني بر يادگيري عميق از روش هاي سنتي عملكرد بهتري داشته اند. با اين وجود، خلأ وجود روش هايي براي حالات خاص شناسايي چهره، مانند شناسايي چهره چندديدي حس مي شود. از طرفي، يكي از چالش هاي مهم در حوزه بينايي ماشين دسته بندي و شناسايي اجسام سه بعدي از جمله چهره است. امري بديهي است، كه براي چهره كه سه بعدي است الگوريتم ها و مدل هاي سه بعدي ارائه گردد، اما به دليل هزينه بالاي اين نوع دوربين ها، زمان طولاني براي ايجاد مدل چهره و همچنين كمبود مجموعه داده هاي سه بعدي، محققين تشويق به استفاده از تصاوير دو بعدي براي شناسايي چهره شده اند. از طرفي توجه به اين نكته ضروري است كه يكي از مزاياي الگوريتم هاي شناسايي چهره سه بعدي، قابليت شناسايي چهره در زواياي مختلف است. در اين پژوهش، يك معماري توسط شبكه عصبي كانولوشن ارائه خواهيم داد كه اطلاعات را از تصاوير چند ديدي (تصاوير مبتني بر منظر) از چهره يك فرد دريافت كرده و اين اطلاعات را به صورت متمركز ادغام كند. در اين پژوهش، مي خواهيم روشي براي شناسايي چهره توسط مجموعه اي از تصاوير دو بعدي ارائه دهيم كه در آن از مزاياي روش هاي شناسايي چهره دو بعدي و سه بعدي بهره ببريم و تا حد امكان معايب هر كدام را كاهش دهيم. هدف از ارائه اين روش افزايش دقت شناسايي چهره افراد توسط مجموعه تصاوير مبتني بر ديد آن ها مي باشد. هدف ديگر، پي بردن به اين نكته است كه ادغام كدام ديدها مي تواند سبب بهترين نتيجه شود. آزمايش ها و آزمون هاي آماري انجام شده نشان دهنده صحت و نيز بهبود روش پيشنهادي است. نتايج به دست آمده از نمودارهاي خطا بر حسب دوره هاي آموزشي و نيز آزمون هاي آماري مانند t-test نشان مي دهد كه روش پيشنهادي عملكرد بهتري نسبت به روش هاي شناسايي چهره در حالت عمومي دارد. واژه‌هاي كليدي: يادگيري عميق، شبكه هاي عصبي كانولوشن، شناسايي چهره چندديدي، بازنمايش چندديدي
تاريخ ورود اطلاعات
1396/12/19
تاريخ بهره برداري
3/10/2018 12:00:00 AM
دانشجوي وارد كننده اطلاعات
سارا شهسواراني
چكيده به لاتين
Deep learning can be considered as a new chapter in the field of machine learning. Deep learning, or deep neural networks, have caused significant advances in various fields, including image processing and machine vision. The results obtained from deep face recognition systems have improved the performance of conventional methods. Nevertheless, lack of methods with specific conditions such as Multi-View Face Recognition is the reason of researches in this area. On the other hand, one of the important challenges in the field of machine vision is to recognize of three-dimensional objects such as faces. Hence, faces as a three-dimensional objects should have three-dimensional algorithms. Three-dimensional cameras are expensive, it takes a long time to create a three-dimensional face model and shortage of three-dimensional face datasets are the reasons that researches encourage to employ two-dimensional face datasets. In this thesis, we present an architecture with convolutional neural networks which achieves information from multi-view face images and aggregates them into a single layer called, aggregating layer. In this thesis, we propose a method for recognizing faces by a set of two-dimensional images which takes advantage of the benefits of the two-dimensional and three-dimensional face recognition methods and reduce any disadvantages. The purpose of this method is to increase the accuracy of recognizing faces of individuals by set of images based on view angles. Another goal is to find that the integration of which views conclude the best results. Experiments indicate that the proposed method outperforms common face recognition method. Keywords: Deep learning, deep convolutional neural network, multi-view face recognition, multi-view representation
لينک به اين مدرک :
http://dl.iust.ac.ir/dL/search/default.aspx?Term=18595&Field=0&DTC=6

کلیه حقوق این اثر برای شرکت مهندسی ارتباطات پيام مشرق محفوظ می باشد