پارسا اساسي مقدم

عنوان

هوشمندسازي سامانه تفكيك كاربران در محيط‌هاي شلوغ با استفاده از چهره‌نگاري و حركت‌نگاري مبتني بر شبكه‌هاي عصبي عميق و تحليل داده‌هاي چندجهته

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي مكانيك

سال تحصيل

1402

تاريخ دفاع

1404/07/27

استاد راهنما

دكتر مجيد رجبي

استاد مشاور

دكتر محمدرضا محمدي

دانشكده

مهندسي مكانيك

چكيده

شناسايي افراد در محيط‌هاي شلوغ و غيرقابل‌كنترل يكي از چالش‌هاي اساسي و پركاربرد در حوزه بينايي ماشين و يادگيري عميق به شمار مي‌رود؛ در اين پژوهش، با هدف توسعه يك سامانه هوشمند چندوجهي براي تشخيص و تفكيك كاربران در شرايط پيچيده محيطي، رويكردي مبتني بر تركيب چندين ويژگي بيومتريك ارائه شده است. روش پيشنهادي بر اساس ادغام دو ويژگي مكمل چهره و گيت (نحوه راه رفتن افراد) طراحي شده است، به‌گونه‌اي كه هر يك بتواند محدوديت‌ها و ضعف‌هاي ديگري را در شرايط مختلف جبران كند. در اين پژوهش، ابتدا دو مدل پيشرفته تشخيص چهره شامل FaceNet و AdaFace پياده‌سازي، آموزش و ارزيابي شدند. مدل FaceNet با استفاده از معماري InceptionResnetV1 و آموزش بر روي مجموعه داده LFW شامل 60,234 تصوير از 5,749 فرد مختلف، به دقت تشخيص 95.66 درصد دست يافت. در ادامه، مدل AdaFace با بهره‌گيري از معماري ResNet-100 و تابع هزينه انطباقي كه نسبت به تغييرات كيفيت تصوير مقاوم‌تر است، عملكرد بهتري از خود نشان داد و دقت 99.82 درصد را ثبت كرد. براي شناسايي افراد بر اساس گيت، مدل EnhancedGaitCNN با ساختاري شامل چهار بلوك كانولوشني طراحي و توسعه داده شد. اين مدل با استفاده از مجموعه داده CASIA-B كه شامل اطلاعات گيت 124 فرد در شرايط مختلف پوشش و زواياي ديد متنوع است، آموزش داده شد تا توانايي استخراج ويژگي‌هاي حركتي پايدار افزايش يابد. پس از ارزيابي جداگانه هر يك از مدل‌ها، دو مدل ادغامي شامل تركيب FaceNet با EnhancedGaitCNN و تركيب AdaFace با EnhancedGaitCNN پياده‌سازي شدند. فرآيند ادغام اطلاعات در سطح امتياز و با استفاده از روش‌هاي مختلفي از جمله وزن‌دهي ثابت، قوانين منطقي، روش‌هاي مبتني بر كيفيت و روش‌هاي مبتني بر يادگيري ماشين انجام گرفت. ارزيابي مدل‌هاي ادغامي بر روي مجموعه داده SMVDU-Single-Gait نشان داد كه مدل تركيبي FaceNet و EnhancedGaitCNN با روش وزن‌دهي ثابت 0.85 به دقت رتبه-1 برابر با 97.01 درصد دست يافته است. همچنين، مدل تركيبي AdaFace و EnhancedGaitCNN با همان روش وزن‌دهي، عملكرد بهتري از خود نشان داد و به دقت رتبه-1 برابر با 98.50 درصد رسيد كه اين مقدار بهبود قابل توجهي نسبت به استفاده مستقل از هر يك از مدل‌ها محسوب مي‌شود. در مجموع، نتايج به‌دست‌آمده قابليت كاربرد عملي سامانه پيشنهادي را در حوزه‌هايي نظير سيستم‌هاي نظارتي هوشمند، كنترل دسترسي و شناسايي افراد در محيط‌هاي واقعي و شلوغ تأييد مي‌كند.

تاريخ ورود اطلاعات

1404/11/04

عنوان به انگليسي

Development of an Intelligent System for User Segmentation in Crowded Environments Using Facial Recognition an‎d Motion Analysis Based on Deep Neural Networks an‎d Multidimensional Data Analysis

تاريخ بهره برداري

10/19/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

پارسا اساسي مقدم

Name: پارسا اساسي مقدم
Author: پارسا اساسي مقدم

چكيده به لاتين

Person identification in crowded environments is one of the significant challenges in the field of computer vision an‎d deep learning. This research aims to develop an intelligent multimodal system for accurate user recognition under complex environmental conditions. The proposed approach is based on combining two biometric features: face an‎d gait (walking pattern), which have the capability to compensate for each other’s limitations. In this research, two face recognition models, FaceNet an‎d AdaFace, were first implemented an‎d eva‎luated. The FaceNet model with InceptionResnetV1 architecture, using the LFW dataset containing 60,234 images from 5,749 individuals, achieved an accuracy of 95.66%. The AdaFace model with ResNet-100 architecture an‎d adaptive loss function demonstrated superior performance with an accuracy of 99.82%. For gait recognition, the EnhancedGaitCNN model with four convolutional blocks was developed an‎d trained using the CASIA-B dataset containing 124 subjects under various conditions an‎d viewing angles. Subsequently, two fusion models comprising the combination of FaceNet with EnhancedGaitCNN an‎d the combination of AdaFace with EnhancedGaitCNN were implemented using various score-level fusion methods. The fusion methods included fixed weighting, rule-based approaches, quality-based methods, an‎d machine learning techniques. Results indicated that the fusion model of AdaFace an‎d EnhancedGaitCNN with weights of 0.85 for face an‎d 0.15 for gait provides the best performance. eva‎luation of the fusion models on the SMVDU-Single-Gait dataset showed that the combined FaceNet an‎d EnhancedGaitCNN model with fixed weight method of 0.85 achieved a rank-1 accuracy of 97.01%. The combined AdaFace an‎d EnhancedGaitCNN model with the same weighting method demonstrated superior performance with a rank-1 accuracy of 98.50%, which represents a significant improvement compared to using either model individually. These results confirm the system’s applicability in surveillance systems, access control, an‎d person identification in real-world environments.

كليدواژه هاي فارسي

تشخيص چهره , تشخيص گيت , تشخيص كاربر , يادگيري عميق , ادغام چندوجهي

كليدواژه هاي لاتين

Face Recognition , Gait Recognition , User Identification , Deep Learning , Multimodal Fusion

Author

Parsa Asasi Moghaddam

SuperVisor

Dr. Majid Rajabi

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34420&Field=0&DTC=6