شماره ركورد
28750
پديد آورنده
محمدحسن شامقلي
عنوان
بازشناسي انسان در ويدئو با استفاده از شبكههاي عصبي مبتني بر هيستوگرام
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
هوش مصنوعي و رباتيكز
سال تحصيل
1397
تاريخ دفاع
1402/1/28
استاد راهنما
محمدرضا محمدي - ناصر مزيني
استاد مشاور
-
دانشكده
مهندسي كامپيوتر
چكيده
در سالهاي اخير، وظيفه بازشناسي انسان در دوربينهاي نظارتي بسيار مورد توجه قرار گرفته است. با گسترش دوربينهاي نظارتي رديابي انسانها توسط نيروي نظارتي بسيار پرهزينه است. شبكههاي عصبي عميق در اين زمينه پيشرفتهاي بسياري كردهاند. در اين وظيفه، شخصي كه از يك دوربين خارج ميشود و وارد ديد دوربين ديگر ميگردد، مدل بايد تشخيص دهد كه اين شخص همان شخص است و هويت قبلياش را به او اختصاص دهد.
در شبكههاي عصبي عميق معمولا از ادغام بيشينه يا ميانگين براي كاهش بعد ويژگيهاي لايه آخر استفاده ميشود. اين ادغامها اطلاعات كمي را با خود حمل ميكنند. براي مثال اطلاعات آماري و توزيع دادهها را با خودشان ندارند. در اين تحقيق قصد داريم لايه هيستوگرام را به عنوان يك استخراجكننده اطلاعات آماري به جاي ادغام بيشينه يا ميانگين استفاده كنيم. يك لايه هيستوگرام پيشنهاد كرديم و آن را با لايه هيستوگرامي كه قبلا پيشنهاد شده بود مقايسه كرديم. تعداد پارامترهاي اين لايه حدود نصف تعداد پارامترهاي لايه هيستوگرام پايه است. همچنين لايه هيستوگرامي پيشنهادي از منفي بينهايت تا مثبت بينهايت محور اعداد را پوشش ميدهد اما هيستوگرام پايه پوشش محدودي دارد. لايه هيستوگرام پيشنهادي توانست معيار mAP را 1.9 درصد و معيار Top1 را 1 درصد بهبود ببخشد. در وظيفه بازشناسي انسان دو مدل هيستوگرامي مورد بررسي نتوانستند معيارهاي مربوط به ادغام بيشينه را بهبود ببخشند. علت اين مورد را بررسي خواهيم كرد. پيادهسازي اين تحقيق در اين آدرس قرار دارد: https://github.com/mhshamgholi/AP3D
تاريخ ورود اطلاعات
1402/07/05
عنوان به انگليسي
Video-based person re-identification with histogram deep neural network
تاريخ بهره برداري
4/16/2024 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محمدحسن شامقلي
چكيده به لاتين
In recent years, the task of person re-identification in surveillance cameras has received much attention. With the spread of surveillance cameras, it is very expensive to monitor people by human surveillance. Deep neural networks have made many advances in this field. In this task, a person who exits from one camera and enters the view of another camera, the model must recognize that this person is the same person and assign his previous identity to him.
In deep neural networks, maximum or average pooling is usually used to reduce the dimension of the features of the last layer. These pooling carry little information with them. For example, they do not have statistical information and data distribution with them. In this research, we intend to use the histogram layer as a statistical information extractor instead of the maximum or average pooling. We proposed a histogram layer and compared it with the previously proposed histogram layer. The number of parameters of this layer is about half the number of parameters of the basic histogram layer. Also, the proposed histogram layer covers the number axis from negative infinity to positive infinity, but the basic histogram has limited coverage. The proposed histogram layer could improve the mAP criterion by 1.9% and the Top1 criterion by 1%. In the task of person re-identification, the two histogram models could not improve the max pooling criteria. We will investigate the cause of this case. Code is available at https://github.com/mhshamgholi/AP3D
كليدواژه هاي فارسي
هيستوگرام , ادغام بيشينه كلي , بازشناسي انسان
كليدواژه هاي لاتين
Histogram , Global Max Pooling , Person Re-identification
Author
Mohammad Hasan Shamgholi
SuperVisor
Mohammad Reza Mohammadi, Naser Mozayani