شماره ركورد
33577
پديد آورنده
رضا صديقي پاشاكي
عنوان
تشخيص اشياء در صحنههاي مهآلود با استفاده از يادگيري عميق
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق گرايش سيستمهاي الكترونيك ديجيتال
سال تحصيل
1400
تاريخ دفاع
1404/03/11
استاد راهنما
دكتر ستار ميرزاكوچكي
استاد مشاور
-
دانشكده
مهندسي برق
چكيده
تشخيص اشياء يكي از حوزههاي حياتي در بينايي ماشين و يادگيري عميق است كه همواره مورد توجه پژوهشگران قرار داشته است. با اين حال، شرايط نامساعد جوي نظير صحنههاي مهآلود، كاهش وضوح تصوير و تغييرات بصري ناشي از مه، چالشهاي جدي براي تشخيص دقيق اشياء ايجاد ميكند. روشهاي كنوني عمدتاً به سه گروه تقسيم ميشوند: روشهاي متوالي، يادگيري چندوظيفهاي و روشهاي تطبيق دامنه (بدوننظارت) كه به رويكرد غالب در اين چالش تبديل شدهاند؛ با اين وجود، وابستگي آنها به دادههاي برچسبدار منبع، سازگاريشان را در سناريوهاي حساس به حريم خصوصي محدود ميسازد. اين پژوهش بر تشخيص اشياء بدون نياز به دادههاي منبع تمركز دارد. رويكرد انتخابي، چهارچوب معلم ميانگين است كه اخيراً در يادگيري خودآموز مورد توجه قرار گرفته، اما بهدليل دو مشكل اساسي دچار افت عملكرد ميشود: نخست، تخريب كنترلنشدهي معلم بهعلت بهروزرسانيهاي ناپايدار از دانشآموز؛ دوم، تمايل مدل دانشآموز به تكرار خطاهاي ناشي از برچسبهاي كاذب نادرست، كه آن را به دام بهينهي محلي مياندازد. براي رفع اين مسائل، مقالهي مرجع مكانيزم «بازآموزي-بهروزرساني پويا» را معرفي كرده كه با مديريت بازخوردمحور فرآيند آموزش، تكامل همزمان دو مدل را تضمين ميكند. ارزيابيها روي دادههاي استاندارد نشاندهندهي برتري روش پيشنهادي نسبت به رويكردهاي موجود و اثبات توانايي تعميم و پايداري آن در شرايط مختلف محيطي است. از جمله مشاركتهاي عملي اين پژوهش، بهرهگيري موفق از روش تجميع گراديانها بود كه با افزايش اندازهي دستهي مؤثر، امكان استفاده از خِرد جمعي دادهها را در قالب دستههاي كوچك فراهم ساخت؛ رويكردي كه امكان آموزش مدلهاي حجيم را با وجود محدوديت حافظهي گرافيكي مهيا كرد. همچنين، ايدهي جابجايي استراتژيك نرمالسازي لايهاي با هدف بهبود همگرايي و عملكرد مدل پيادهسازي شد كه اگرچه به دليل چالشهايي مانند تنظيم غيربهينهي هايپرپارامترها موفقيت كامل نداشت، اما ظرفيت بالقوهاي براي توسعه دارد. در پايان، اين پاياننامه با ارائهي مجموعهاي از يافتههاي كاربردي و پيشنهاداتي ارزشمند، مسير را براي پژوهشهاي آينده در حوزهي تشخيص اشياء در شرايط دشوار جوي هموار ميسازد.
تاريخ ورود اطلاعات
1404/06/03
عنوان به انگليسي
Object Detection in Foggy Scenes using Deep Learning
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
رضا صديقي پاشاكي
چكيده به لاتين
Object detection is a critical area in computer vision and deep learning that has consistently attracted the attention of researchers. However, adverse weather conditions such as foggy scenes, reduced image clarity, and visual distortions caused by fog pose significant challenges to accurate object detection. Existing methods are generally categorized into three groups: sequential approaches, multi-task learning approaches, and unsupervised domain adaptation methods, the latter of which has become the dominant strategy for tackling this challenge. Nevertheless, their reliance on labeled source data limits their applicability in privacy-sensitive scenarios. This study focuses on source-free object detection (SFOD). The chosen approach is the Mean Teacher framework, which has recently gained attention in self-training. However, it suffers from two fundamental issues: first, uncontrolled degradation of the teacher due to unstable updates from the student; second, the student model’s tendency to replicate errors caused by incorrect pseudo-labels, trapping it in a local optimum. To overcome these issues, the referenced paper introduces a novel "Dynamic Retraining-Updating (DRU)" mechanism, which actively manages the studentʹs training process and the teacher modelʹs updates in a feedback-driven manner, ensuring their simultaneous evolution. evaluations on standard datasets demonstrate the superiority of this method over existing approaches and confirm its generalization capability and robustness across diverse environmental conditions. Among the practical contributions of this research is the successful application of gradient accumulation, which, by increasing the effective batch size, enabled leveraging the collective wisdom of data across multiple mini-batches, a strategy that facilitates training large models despite limited GPU memory. Additionally, the idea of strategically shifting the layer normalization position was implemented to improve model convergence and performance. Although this approach did not achieve complete success due to challenges such as suboptimal hyperparameter tuning, it shows promising potential for future development. In conclusion, this thesis presents a collection of practical findings and valuable suggestions that pave the way for future research in object detection under adverse weather conditions.
كليدواژه هاي فارسي
تشخيص اشياء بدونمنبع (SFOD) , يادگيري عميق , معلم ميانگين , يادگيري خودآموز
كليدواژه هاي لاتين
Source-Free Object Detection (SFOD) , Deep Learning , Mean Teacher , Self-training
Author
Reza Sedighi Pashaki
SuperVisor
Dr. Sattar Mirzakuchaki