رضا صديقي پاشاكي

عنوان

تشخيص اشياء در صحنه‌هاي مه‌آلود با استفاده از يادگيري عميق

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي برق گرايش سيستم‌هاي الكترونيك ديجيتال

سال تحصيل

1400

تاريخ دفاع

1404/03/11

استاد راهنما

دكتر ستار ميرزاكوچكي

استاد مشاور

دانشكده

مهندسي برق

چكيده

تشخيص اشياء يكي از حوزه‌هاي حياتي در بينايي ماشين و يادگيري عميق است كه همواره مورد توجه پژوهشگران قرار داشته است. با اين حال، شرايط نامساعد جوي نظير صحنه‌هاي مه‌آلود، كاهش وضوح تصوير و تغييرات بصري ناشي از مه، چالش‌هاي جدي براي تشخيص دقيق اشياء ايجاد مي‌كند. روش‌هاي كنوني عمدتاً به سه گروه تقسيم مي‌شوند: روش‌هاي متوالي، يادگيري چندوظيفه‌اي و روش‌هاي تطبيق دامنه‌ (بدون‌نظارت) كه به رويكرد غالب در اين چالش تبديل شده‌اند؛ با اين وجود، وابستگي آن‌ها به داده‌هاي برچسب‌دار منبع، سازگاري‌شان را در سناريوهاي حساس به حريم خصوصي محدود مي‌سازد. اين پژوهش بر تشخيص اشياء بدون نياز به داده‌هاي منبع تمركز دارد. رويكرد انتخابي، چهارچوب معلم ميانگين است كه اخيراً در يادگيري خودآموز مورد توجه قرار گرفته، اما به‌دليل دو مشكل اساسي دچار افت عملكرد مي‌شود: نخست، تخريب كنترل‌نشده‌ي معلم به‌علت به‌روزرساني‌هاي ناپايدار از دانش‌آموز؛ دوم، تمايل مدل دانش‌آموز به تكرار خطاهاي ناشي از برچسب‌هاي‌ كاذب نادرست، كه آن را به دام بهينه‌ي محلي مي‌اندازد. براي رفع اين مسائل، مقاله‌ي مرجع مكانيزم «بازآموزي-به‌روزرساني پويا» را معرفي كرده كه با مديريت بازخوردمحور فرآيند آموزش، تكامل همزمان دو مدل را تضمين مي‌كند. ارزيابي‌ها روي داده‌هاي استاندارد نشان‌دهنده‌ي برتري روش پيشنهادي نسبت به رويكردهاي موجود و اثبات توانايي تعميم و پايداري آن در شرايط مختلف محيطي است. از جمله مشاركت‌هاي عملي اين پژوهش، بهره‌گيري موفق از روش تجميع گراديان‌ها بود كه با افزايش اندازه‌ي دسته‌ي مؤثر، امكان استفاده از خِرد جمعي داده‌ها را در قالب دسته‌هاي كوچك فراهم ساخت؛ رويكردي كه امكان آموزش مدل‌هاي حجيم را با وجود محدوديت حافظه‌ي گرافيكي مهيا كرد. همچنين، ايده‌ي جابجايي استراتژيك نرمال‌سازي لايه‌اي با هدف بهبود همگرايي و عملكرد مدل پياده‌سازي شد كه اگرچه به دليل چالش‌هايي مانند تنظيم غيربهينه‌ي هايپرپارامترها موفقيت كامل نداشت، اما ظرفيت بالقوه‌اي براي توسعه دارد. در پايان، اين پايان‌نامه با ارائه‌ي مجموعه‌اي از يافته‌هاي كاربردي و پيشنهاداتي ارزشمند، مسير را براي پژوهش‌هاي آينده در حوزه‌ي تشخيص اشياء در شرايط دشوار جوي هموار مي‌سازد.

تاريخ ورود اطلاعات

1404/06/03

عنوان به انگليسي

Object Detection in Foggy Scenes using Deep Learning

تاريخ بهره برداري

1/1/1900 12:00:00 AM

دانشجوي وارد كننده اطلاعات

رضا صديقي پاشاكي

Name: رضا صديقي پاشاكي
Author: رضا صديقي پاشاكي

چكيده به لاتين

Object detection is a critical area in computer vision an‎d deep learning that has consistently attracted the attention of researchers. However, adverse weather conditions such as foggy scenes, reduced image clarity, an‎d visual distortions caused by fog pose significant challenges to accurate object detection. Existing methods are generally categorized into three groups: sequential approaches, multi-task learning approaches, an‎d unsupervised domain adaptation methods, the latter of which has become the dominant strategy for tackling this challenge. Nevertheless, their reliance on labeled source data limits their applicability in privacy-sensitive scenarios. This study focuses on source-free object detection (SFOD). The chosen approach is the Mean Teacher framework, which has recently gained attention in self-training. However, it suffers from two fundamental issues: first, uncontrolled degradation of the teacher due to unstable updat‎es from the student; second, the student model’s tendency to replicate errors caused by incorrect pseudo-labels, trapping it in a local optimum. To overcome these issues, the referenced paper introduces a novel "Dynamic Retraining-Updating (DRU)" mechanism, which actively manages the studentʹs training process an‎d the teacher modelʹs updat‎es in a feedback-driven manner, ensuring their simultaneous evolution. eva‎luations on stan‎dard datasets demonstrate the superiority of this method over existing approaches an‎d confirm its generalization capability an‎d robustness across diverse environmental conditions. Among the practical contributions of this research is the successful application of gradient accumulation, which, by increasing the effective batch size, enabled leveraging the collective wisdom of data across multiple mini-batches, a strategy that facilitates training large models despite limited GPU memory. Additionally, the idea of strategically shifting the layer normalization position was implemented to improve model convergence an‎d performance. Although this approach did not achieve complete success due to challenges such as suboptimal hyperparameter tuning, it shows promising potential for future development. In conclusion, this thesis presents a collection of practical findings an‎d valuable suggestions that pave the way for future research in object detection under adverse weather conditions.

كليدواژه هاي فارسي

تشخيص اشياء بدون‌منبع (SFOD) , يادگيري عميق , معلم ميانگين , يادگيري خودآموز

كليدواژه هاي لاتين

Source-Free Object Detection (SFOD) , Deep Learning , Mean Teacher , Self-training

Author

Reza Sedighi Pashaki

SuperVisor

Dr. Sattar Mirzakuchaki

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=33577&Field=0&DTC=6