• شماره ركورد
    28750
  • پديد آورنده

    محمدحسن شامقلي

  • عنوان
    بازشناسي انسان در ويدئو با استفاده از شبكه‌هاي عصبي مبتني بر هيستوگرام
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    هوش مصنوعي و رباتيكز
  • سال تحصيل
    1397
  • تاريخ دفاع
    1402/1/28
  • استاد راهنما
    محمدرضا محمدي - ناصر مزيني
  • استاد مشاور
    -
  • دانشكده
    مهندسي كامپيوتر
  • چكيده
    در سال‌هاي اخير، وظيفه بازشناسي انسان در دوربين‌هاي نظارتي بسيار مورد توجه قرار گرفته است. با گسترش دوربين‌هاي نظارتي رديابي انسان‌ها توسط نيروي نظارتي بسيار پرهزينه است. شبكه‌هاي عصبي عميق در اين زمينه پيشرفت‌هاي بسياري كرده‌اند. در اين وظيفه، شخصي كه از يك دوربين خارج مي‌شود و وارد ديد دوربين ديگر مي‌گردد، مدل بايد تشخيص دهد كه اين شخص همان شخص است و هويت قبلي‌اش را به او اختصاص دهد. در شبكه‌هاي عصبي عميق معمولا از ادغام بيشينه يا ميانگين براي كاهش بعد ويژگي‌هاي لايه آخر استفاده مي‌شود. اين ادغام‌ها اطلاعات كمي را با خود حمل مي‌كنند. براي مثال اطلاعات آماري و توزيع داده‌ها را با خود‌شان ندارند. در اين تحقيق قصد داريم لايه هيستوگرام را به عنوان يك استخراج‌كننده اطلاعات آماري به جاي ادغام بيشينه يا ميانگين استفاده كنيم. يك لايه هيستوگرام پيشنهاد كرديم و آن را با لايه هيستوگرامي كه قبلا پيشنهاد شده بود مقايسه كرديم. تعداد پارامترهاي اين لايه حدود نصف تعداد پارامترهاي لايه هيستوگرام پايه است. همچنين لايه هيستوگرامي پيشنهادي از منفي بينهايت تا مثبت بينهايت محور اعداد را پوشش مي‌دهد اما هيستوگرام پايه پوشش محدودي دارد. لايه هيستوگرام پيشنهادي توانست معيار mAP را 1.9 درصد و معيار Top1 را 1 درصد بهبود ببخشد. در وظيفه بازشناسي انسان دو مدل هيستوگرامي مورد بررسي نتوانستند معيارهاي مربوط به ادغام بيشينه را بهبود ببخشند. علت اين مورد را بررسي خواهيم كرد. پياده‌سازي اين تحقيق در اين آدرس قرار دارد: https://github.com/mhshamgholi/AP3D
  • تاريخ ورود اطلاعات
    1402/07/05
  • عنوان به انگليسي
    Video-based person re-identification with histogram deep neural network
  • تاريخ بهره برداري
    4/16/2024 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    محمدحسن شامقلي

  • چكيده به لاتين
    In recent years, the task of person re-identification in surveillance cameras has received much attention. With the spread of surveillance cameras, it is very expensive to monitor people by human surveillance. Deep neural networks have made many advances in this field. In this task, a person who exits from one camera and enters the view of another camera, the model must recognize that this person is the same person and assign his previous identity to him. In deep neural networks, maximum or average pooling is usually used to reduce the dimension of the features of the last layer. These pooling carry little information with them. For example, they do not have statistical information and data distribution with them. In this research, we intend to use the histogram layer as a statistical information extractor instead of the maximum or average pooling. We proposed a histogram layer and compared it with the previously proposed histogram layer. The number of parameters of this layer is about half the number of parameters of the basic histogram layer. Also, the proposed histogram layer covers the number axis from negative infinity to positive infinity, but the basic histogram has limited coverage. The proposed histogram layer could improve the mAP criterion by 1.9% and the Top1 criterion by 1%. In the task of person re-identification, the two histogram models could not improve the max pooling criteria. We will investigate the cause of this case. Code is available at https://github.com/mhshamgholi/AP3D
  • كليدواژه هاي فارسي
    هيستوگرام , ادغام بيشينه كلي , بازشناسي انسان
  • كليدواژه هاي لاتين
    Histogram , Global Max Pooling , Person Re-identification
  • Author
    Mohammad Hasan Shamgholi
  • SuperVisor
    Mohammad Reza Mohammadi, Naser Mozayani