• شماره ركورد
    22576
  • پديد آورنده

    سارا وصالي برازنده

  • عنوان
    رديابي انسان در تصاوير ويدئويي با استفاده از يادگيري عميق
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    الكترونيك ديجيتال
  • سال تحصيل
    1396-1399
  • تاريخ دفاع
    1399/6/26
  • استاد راهنما
    دكتر شهريار برادران شكوهي
  • دانشكده
    برق
  • چكيده
    رديابي بصري انسان يك كار تحقيقاتي اساسي در بينايي ماشين بوده و طي دهه‌هاي اخير توجه زيادي را به خود جلب كرده است. با وجود پيشرفت‌هاي چشمگير، رديابي با استفاده از دوربين طيف مرئي، در برخي از شرايط پيچيده مانند روشنايي كم در شب، درهم‌ريختگي پس‌زمينه و هم‌چنين شرايط آب و هوايي بد ( باران ، مه ، دود و غيره )، كار بسيار چالش برانگيز است. با توجه به اينكه دوربين‌هاي حرارتي مي‌توانند اشعه مادون قرمز ساطع شده توسط افراد با دماي بالاتر از صفر مطلق را ضبط كنند، استفاده از داده‌هاي حرارتي در كنار داده‌هاي مرئي مي‌تواند اطلاعات بيشتري از صحنه را در اختيار ردياب قرار داده و موجب بهبود عملكرد آن شود. اين دوربين‌ها نسبت به دوربين‌هاي طيف مرئي داراي مزيت توانايي تصويربرداري در تاريكي و مقاومت نسبت به تغييرات روشنايي و سايه روشن‌ها هستند. با اين حساب با به كارگيري داده‌هاي RGB-TIR مي‌توان در روز و شرايط مساعد آب و هوايي از اطلاعاتي كه تصاوير مرئي در اختيار گذاشته‌اند، بهره برد و در تاريكي و شرايط بد روشنايي و جوي از اطلاعات تصاوير حرارتي استفاده كرد. ردياب‌هاي حوزه‌ي يادگيري عميق با استفاده از ويژگي‌هاي سطح بالا از دقت بالايي برخوردارند ولي به دليل حجم محاسباتي زياد عموما از سرعت پايين رنج مي‌برند. ردياب پيشنهادي در اين پژوهش با هدف بالا بردن سرعت ردياب مبتني بر يادگيري عميق با استفاده از داده‌هاي RGB-TIR ارائه شده است. اين ردياب از دو آداپتور عمومي و مخصوص براي بهره‌گيري از تصاوير مرئي و حرارتي به طور هم‌زمان استفاده شده است. آداپتور عمومي هر دو تصوير را گرفته و خصوصيات و ويژ‌گي‌هاي مشترك بين اين دو تصوير را استخراج مي‌نمايد. آداپتور خصوصي از دو شاخه تشكيل شده است كه هر يك متعلق به يكي از تصاوير است و ويژگي‌هاي خاص هر يك از آن‌ها را فرا مي‌گيرد. در نهايت اين ويژگي‌ها با هم تركيب شده و با استفاده از لايه‌ي RoIAlign، ويژگي‌هاي هر كي از ناحيه‌هاي محتمل حاوي هدف استخراج مي‌شود. آداپتور نمونه با هدف مدل‌سازي تغييرات ظاهري هدف و استنتاج، اين ويژگي‌ها را گرفته و مكان هدف را مشخص مي‌نمايد. آزمايش‌هاي مختلفي كه روي مجموعه داده‌ي RGBT234 انجام شده، نشان داده است كه ردياب ارائه شده با توجه به معيارهاي SR و PR نسبت به ردياب‌هاي ديگر در حوزه خود كارايي بيشتري داشته و با سرعت 10.2 فريم در ثانيه به دقت و مقاومت به ترتيب 0.744 و 0.519 رسيده است.
  • تاريخ ورود اطلاعات
    1399/08/06
  • عنوان به انگليسي
    Video-based human tracking using deep learning
  • تاريخ بهره برداري
    9/17/2021 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    سارا وصالي برازنده

  • چكيده به لاتين
    Visual tracking of humans has been one of the most impressive and important areas in machine vision and has attracted a great deal of attention in recent decades. Despite significant improvements, RGB-based object tracking can be very challenging in some complex situations, such as low illumination, background clutter, as well as bad weather (rain, fog, smoke, etc). Thermal cameras can record infrared radiation emitted by people with temperatures above absolute zero, therefore using thermal data, as well as visible data, could provide more information from the scene to the tracker and improve its performance. These cameras can shoot in the dark as an advantage, and they resist the changes in brightness and light shadows over visible spectrum cameras. On that account, by using RGB-TIR data, the information provided by visible images can be used in normal illumination and weather conditions, and thermal image information can be used in darkness and low illumination conditions. In this study, the proposed tracker has two adapters including general and modality, to use visible and thermal images simultaneously. The general adapter takes both images and extracts the common features between the two modalities. The modality adapter consists of two branches that each belong to one of the images and encodes modality-specific information. Finally, these features are concatenated, and using the RoIAlign layer, the features of each region of interest are extracted. The instance adapter captures these features and specifies the location of the target. The achieved results from the proposed method on recent challenging benchmarks prove that this proposed tracking approach is more efficient than state-of-the-art trackers and has good speed and accuracy.