-
شماره ركورد
28750
-
پديد آورنده
محمدحسن شامقلي
-
عنوان
بازشناسي انسان در ويدئو با استفاده از شبكههاي عصبي مبتني بر هيستوگرام
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
هوش مصنوعي و رباتيكز
-
سال تحصيل
1397
-
تاريخ دفاع
1402/1/28
-
استاد راهنما
محمدرضا محمدي - ناصر مزيني
-
استاد مشاور
-
-
دانشكده
مهندسي كامپيوتر
-
چكيده
در سالهاي اخير، وظيفه بازشناسي انسان در دوربينهاي نظارتي بسيار مورد توجه قرار گرفته است. با گسترش دوربينهاي نظارتي رديابي انسانها توسط نيروي نظارتي بسيار پرهزينه است. شبكههاي عصبي عميق در اين زمينه پيشرفتهاي بسياري كردهاند. در اين وظيفه، شخصي كه از يك دوربين خارج ميشود و وارد ديد دوربين ديگر ميگردد، مدل بايد تشخيص دهد كه اين شخص همان شخص است و هويت قبلياش را به او اختصاص دهد.
در شبكههاي عصبي عميق معمولا از ادغام بيشينه يا ميانگين براي كاهش بعد ويژگيهاي لايه آخر استفاده ميشود. اين ادغامها اطلاعات كمي را با خود حمل ميكنند. براي مثال اطلاعات آماري و توزيع دادهها را با خودشان ندارند. در اين تحقيق قصد داريم لايه هيستوگرام را به عنوان يك استخراجكننده اطلاعات آماري به جاي ادغام بيشينه يا ميانگين استفاده كنيم. يك لايه هيستوگرام پيشنهاد كرديم و آن را با لايه هيستوگرامي كه قبلا پيشنهاد شده بود مقايسه كرديم. تعداد پارامترهاي اين لايه حدود نصف تعداد پارامترهاي لايه هيستوگرام پايه است. همچنين لايه هيستوگرامي پيشنهادي از منفي بينهايت تا مثبت بينهايت محور اعداد را پوشش ميدهد اما هيستوگرام پايه پوشش محدودي دارد. لايه هيستوگرام پيشنهادي توانست معيار mAP را 1.9 درصد و معيار Top1 را 1 درصد بهبود ببخشد. در وظيفه بازشناسي انسان دو مدل هيستوگرامي مورد بررسي نتوانستند معيارهاي مربوط به ادغام بيشينه را بهبود ببخشند. علت اين مورد را بررسي خواهيم كرد. پيادهسازي اين تحقيق در اين آدرس قرار دارد: https://github.com/mhshamgholi/AP3D
-
تاريخ ورود اطلاعات
1402/07/05
-
عنوان به انگليسي
Video-based person re-identification with histogram deep neural network
-
تاريخ بهره برداري
4/16/2024 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
محمدحسن شامقلي
-
چكيده به لاتين
In recent years, the task of person re-identification in surveillance cameras has received much attention. With the spread of surveillance cameras, it is very expensive to monitor people by human surveillance. Deep neural networks have made many advances in this field. In this task, a person who exits from one camera and enters the view of another camera, the model must recognize that this person is the same person and assign his previous identity to him.
In deep neural networks, maximum or average pooling is usually used to reduce the dimension of the features of the last layer. These pooling carry little information with them. For example, they do not have statistical information and data distribution with them. In this research, we intend to use the histogram layer as a statistical information extractor instead of the maximum or average pooling. We proposed a histogram layer and compared it with the previously proposed histogram layer. The number of parameters of this layer is about half the number of parameters of the basic histogram layer. Also, the proposed histogram layer covers the number axis from negative infinity to positive infinity, but the basic histogram has limited coverage. The proposed histogram layer could improve the mAP criterion by 1.9% and the Top1 criterion by 1%. In the task of person re-identification, the two histogram models could not improve the max pooling criteria. We will investigate the cause of this case. Code is available at https://github.com/mhshamgholi/AP3D
-
كليدواژه هاي فارسي
هيستوگرام , ادغام بيشينه كلي , بازشناسي انسان
-
كليدواژه هاي لاتين
Histogram , Global Max Pooling , Person Re-identification
-
Author
Mohammad Hasan Shamgholi
-
SuperVisor
Mohammad Reza Mohammadi, Naser Mozayani
-
لينک به اين مدرک :