شماره ركورد
34420
پديد آورنده
پارسا اساسي مقدم
عنوان
هوشمندسازي سامانه تفكيك كاربران در محيطهاي شلوغ با استفاده از چهرهنگاري و حركتنگاري مبتني بر شبكههاي عصبي عميق و تحليل دادههاي چندجهته
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي مكانيك
سال تحصيل
1402
تاريخ دفاع
1404/07/27
استاد راهنما
دكتر مجيد رجبي
استاد مشاور
دكتر محمدرضا محمدي
دانشكده
مهندسي مكانيك
چكيده
شناسايي افراد در محيطهاي شلوغ و غيرقابلكنترل يكي از چالشهاي اساسي و پركاربرد در حوزه بينايي ماشين و يادگيري عميق به شمار ميرود؛ در اين پژوهش، با هدف توسعه يك سامانه هوشمند چندوجهي براي تشخيص و تفكيك كاربران در شرايط پيچيده محيطي، رويكردي مبتني بر تركيب چندين ويژگي بيومتريك ارائه شده است. روش پيشنهادي بر اساس ادغام دو ويژگي مكمل چهره و گيت (نحوه راه رفتن افراد) طراحي شده است، بهگونهاي كه هر يك بتواند محدوديتها و ضعفهاي ديگري را در شرايط مختلف جبران كند. در اين پژوهش، ابتدا دو مدل پيشرفته تشخيص چهره شامل FaceNet و AdaFace پيادهسازي، آموزش و ارزيابي شدند. مدل FaceNet با استفاده از معماري InceptionResnetV1 و آموزش بر روي مجموعه داده LFW شامل 60,234 تصوير از 5,749 فرد مختلف، به دقت تشخيص 95.66 درصد دست يافت. در ادامه، مدل AdaFace با بهرهگيري از معماري ResNet-100 و تابع هزينه انطباقي كه نسبت به تغييرات كيفيت تصوير مقاومتر است، عملكرد بهتري از خود نشان داد و دقت 99.82 درصد را ثبت كرد. براي شناسايي افراد بر اساس گيت، مدل EnhancedGaitCNN با ساختاري شامل چهار بلوك كانولوشني طراحي و توسعه داده شد. اين مدل با استفاده از مجموعه داده CASIA-B كه شامل اطلاعات گيت 124 فرد در شرايط مختلف پوشش و زواياي ديد متنوع است، آموزش داده شد تا توانايي استخراج ويژگيهاي حركتي پايدار افزايش يابد. پس از ارزيابي جداگانه هر يك از مدلها، دو مدل ادغامي شامل تركيب FaceNet با EnhancedGaitCNN و تركيب AdaFace با EnhancedGaitCNN پيادهسازي شدند. فرآيند ادغام اطلاعات در سطح امتياز و با استفاده از روشهاي مختلفي از جمله وزندهي ثابت، قوانين منطقي، روشهاي مبتني بر كيفيت و روشهاي مبتني بر يادگيري ماشين انجام گرفت. ارزيابي مدلهاي ادغامي بر روي مجموعه داده SMVDU-Single-Gait نشان داد كه مدل تركيبي FaceNet و EnhancedGaitCNN با روش وزندهي ثابت 0.85 به دقت رتبه-1 برابر با 97.01 درصد دست يافته است. همچنين، مدل تركيبي AdaFace و EnhancedGaitCNN با همان روش وزندهي، عملكرد بهتري از خود نشان داد و به دقت رتبه-1 برابر با 98.50 درصد رسيد كه اين مقدار بهبود قابل توجهي نسبت به استفاده مستقل از هر يك از مدلها محسوب ميشود. در مجموع، نتايج بهدستآمده قابليت كاربرد عملي سامانه پيشنهادي را در حوزههايي نظير سيستمهاي نظارتي هوشمند، كنترل دسترسي و شناسايي افراد در محيطهاي واقعي و شلوغ تأييد ميكند.
تاريخ ورود اطلاعات
1404/11/04
عنوان به انگليسي
Development of an Intelligent System for User Segmentation in Crowded Environments Using Facial Recognition and Motion Analysis Based on Deep Neural Networks and Multidimensional Data Analysis
تاريخ بهره برداري
10/19/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
پارسا اساسي مقدم
چكيده به لاتين
Person identification in crowded environments is one of the significant challenges in the field of computer vision and deep learning. This research aims to develop an intelligent multimodal system for accurate user recognition under complex environmental conditions. The proposed approach is based on combining two biometric features: face and gait (walking pattern), which have the capability to compensate for each other’s limitations. In this research, two face recognition models, FaceNet and AdaFace, were first implemented and evaluated. The FaceNet model with InceptionResnetV1 architecture, using the LFW dataset containing 60,234 images from 5,749 individuals, achieved an accuracy of 95.66%. The AdaFace model with ResNet-100 architecture and adaptive loss function demonstrated superior performance with an accuracy of 99.82%. For gait recognition, the EnhancedGaitCNN model with four convolutional blocks was developed and trained using the CASIA-B dataset containing 124 subjects under various conditions and viewing angles. Subsequently, two fusion models comprising the combination of FaceNet with EnhancedGaitCNN and the combination of AdaFace with EnhancedGaitCNN were implemented using various score-level fusion methods. The fusion methods included fixed weighting, rule-based approaches, quality-based methods, and machine learning techniques. Results indicated that the fusion model of AdaFace and EnhancedGaitCNN with weights of 0.85 for face and 0.15 for gait provides the best performance. evaluation of the fusion models on the SMVDU-Single-Gait dataset showed that the combined FaceNet and EnhancedGaitCNN model with fixed weight method of 0.85 achieved a rank-1 accuracy of 97.01%. The combined AdaFace and EnhancedGaitCNN model with the same weighting method demonstrated superior performance with a rank-1 accuracy of 98.50%, which represents a significant improvement compared to using either model individually. These results confirm the system’s applicability in surveillance systems, access control, and person identification in real-world environments.
كليدواژه هاي فارسي
تشخيص چهره , تشخيص گيت , تشخيص كاربر , يادگيري عميق , ادغام چندوجهي
كليدواژه هاي لاتين
Face Recognition , Gait Recognition , User Identification , Deep Learning , Multimodal Fusion
Author
Parsa Asasi Moghaddam
SuperVisor
Dr. Majid Rajabi