-
شماره ركورد
23811
-
پديد آورنده
حوريه سادات جمالي دينان
-
عنوان
بازشناسي و بازيابي مفهومي هويت انسان از تصاوير ديده باني با استفاده از ارائه ويژگي هاي مكاني
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
كامپيوتر-هوش مصنوعي
-
سال تحصيل
1394
-
تاريخ دفاع
29/07/1397
-
استاد راهنما
محمود فتحي
-
استاد مشاور
محمود فتحي
-
دانشكده
كامپيوتر
-
چكيده
بازشناسي هويت انسان به شناسايي افراد از طريق تصاويري كه توسط دوربين هاي مختلف و با توسط يك دوربين در زمان هاي مختلف ثبت شده است مي پردازد.براي تحقق اين هدف از يك شبكه يادگيري عميق استفاده مي شود. اين شبكه توسط مجموعه دادگان رايج در اين زمينه آموزش داده مي شود و سپس به عنوان ورودي دو تصوير را دريافت مي كند. در اين پروژه ما بايد قادر باشيم كه تشخيص دهيم كه آيا دو تصوير بيانگر يك شخص هستند و يا تصوير دو شخص متفاوت را نمايش مي دهند . ساختار اصلي مساله بازشناسي هويت بسيار به مسائل تشخيص بيومتريك (مانند تشخيص صورت و غيره) شباهت دارد. در تمامي اين مسائل راه حل اصلي مبتني بر پيدا كردن يك متريك مناسب براي ارزيابي شباهت بين نمونه هاي مختلف مي باشد. از آن جا كه در مساله بازشناسي هويت تنوع تصاوير مختلف انسان زياد مي باشد و اين تصاوير توسط دوربين هاي مختلف با حوزه ديدهاي متنوع ثبت شده است و هم چنين انسان در موقعيت هاي مختلف در هر تصوير ظاهر مي شود، مانند اين كه در يك تصوير فرد پشت به دوربين قرار گرفته است و در تصوير ديگر به صورت نيم رخ در تصوير ظاهر شده است پيدا كردن يك متريك خاص مانند مسائل تشخيص بيومتريك سودمند نمي باشد. از اين رو در يادگيري عميق روش هاي بسيار مناسبي براي پيدا كردن اين مشكل ايجاد شده است كه از رنگ و تار و پود(texture) تصوير تمامي ويژگي هاي لازم را استخراج مي كند و سپس به بررسي شباهت اين ويژگي ها مي پردازد . در اين پژوهش به بررسي معماري هاي قبلي و معرفي دو معماري جديد پرداختيم. به منظور نمايش دقت معماري هاي جديد در معماري اول از مجموعه دادگان CUHK03,CUHK01,PRID,VIPeR,3DpeSو iLIDS استفاده كرديم و در معماري دوم فقط از مجموعه داده هاي CUHK03,CUHK01 و VIPeR استفاده شد. در هر دو معماري و بر روي همه مجموعه دادگان دقت ها نسبت به معماري هاي قبلي افزايش پيدا مي كرد به گونه اي كه در معماري اول به صورت ميانگين بر روي همه مجموعه دادگان6.16 درصد افزايش دقت و در معماري دوم حدود 7.6 درصد افزايش پيدا كرد
-
تاريخ ورود اطلاعات
1399/12/10
-
عنوان به انگليسي
Person Re-Identification and Retrieval from Monitoring Image by Spatial Feature Representation
-
تاريخ بهره برداري
10/21/2018 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
حوريه سادات جمالي دينان
-
چكيده به لاتين
Human identity recognition identifies people through images captured by different cameras and by a single camera at different times. A deep learning network is used to achieve this goal. This network is trained by the common data set in this field and then receives two images as input. In this project, we must be able to distinguish whether two images represent one person or two different people. The basic structure of the problem of identity recognition is very similar to the problems of biometric recognition (such as face recognition, etc.). In all these cases, the main solution is based on finding a suitable metric to evaluate the similarity between different samples. Since there is a great variety of different human images in the issue of identity recognition, and these images have been recorded by different cameras with different fields of view, and also human beings appear in different positions in each image, such as in one image. The person is facing the camera and in the other image appears as a profile in the image. Finding a specific metric such as biometric detection issues is not helpful. Therefore, in deep learning, very suitable methods have been created to find this problem, which extracts all the necessary features from the color and texture of the image and then examines the similarity of these features. In this research, we reviewed previous architectures and introduced two new architectures. In order to show the accuracy of new architectures in the first architecture, we used CUHK03, CUHK01, PRID, VIPeR, 3DpeS and iLIDS datasets, and in the second architecture, only CUHK03, CUHK01 and VIPeR datasets were used. In both architectures and on all data sets, the accuracy increased compared to the previous architectures, so that in the first architecture, on average, the accuracy on all data sets increased by 6.16%, and in the second architecture, it increased by about 7.6%.
-
كليدواژه هاي فارسي
يادگيري عميق , بينايي كامپيوتر , بازشناسي هويت انسان , بازيابي هويت انسان , پردازش تصوير
-
كليدواژه هاي لاتين
Deep Learning , computer vision , person re-identification , person retrieval , image processing
-
لينک به اين مدرک :