-
شماره ركورد
31592
-
پديد آورنده
حميدرضا حيدرزاده مقدم
-
عنوان
طراحي يك الگوريتم پردازش تصوير بهمنظور كاهش اغتشاشات لرزشي تصاوير دوربينهاي قطار به كمك شبكههاي عصبي كانولوشنال
-
مقطع تحصيلي
ارشد
-
رشته تحصيلي
مهندسي كنترل و علائم
-
سال تحصيل
1400
-
تاريخ دفاع
1403/07/14
-
استاد راهنما
دكتر بهمن قرباني واقعي
-
استاد مشاور
.
-
دانشكده
راه آهن
-
چكيده
هوش مصنوعي و بينايي كامپيوتر از فناوريهاي پيشرو در دنياي امروز محسوب ميشوند كه نقشي كليدي در بهبود دقت و سرعت پردازش دادههاي بصري در صنايع مختلف ايفا كردهاند. در صنعت ريلي، اين فناوريها در سيستمهاي قطارهاي خودران براي شناسايي موانع، تشخيص سيگنالها و ارزيابي تقاطعهاي همسطح بهكار گرفته ميشوند. عملكرد صحيح اين سيستمها به كيفيت تصاوير ورودي به شبكههاي عصبي وابسته است و هرگونه كاهش كيفيت ميتواند به مشكلاتي مانند خطا در تشخيص، ارزيابي نادرست و تهديد ايمني منجر شود.
در صنعت ريلي، عواملي مانند سرعت بالاي قطار، شرايط مسير و تغييرات جوي نظير باد و باران، لرزشهاي شديد و تصادفي دوربينها را به همراه دارند كه باعث تاري تصاوير ورودي به شبكههاي عصبي ميشود. اين شرايط نيازمند راهكاري مؤثر براي حفظ كيفيت تصاوير ورودي است. در اين راستا، شبكه DeblurGAN-v2 با ساختار MobileNet-DSC، كه پيشتر براي رفع تاري لرزشهاي كم و متوسط عملكرد مطلوبي ارائه داده بود، بهعنوان شبكه پايه انتخاب گرديد.
با توجه به ماهيت پيچيده و تصادفي لرزشها در صنعت ريلي، تغييرات هدفمندي در ساختار ژنراتور شبكه اعمال شد. اين تغييرات شامل افزايش تعداد لايههاي كانولوشن براي استخراج بهتر ويژگيها، افزايش ابعاد فيلترها جهت درك جزئيات بيشتر، افزودن لايههاي Attention براي تمركز بر نواحي كليدي تصوير و بهينهسازي لايههاي نمونهبرداري كاهشي و افزايشي جهت بازسازي بهتر تصاوير بود. اين اصلاحات منجر به بهبود قابلتوجه شاخصهاي كيفيت تصوير، از جمله PSNR و SSIM، شد و در عين حال معيارهاي كليدي صنعتي نظير زمان پردازش و فلاپس (بيانگر ميزان عمليات محاسباتي) در محدوده استانداردهاي صنعت ريلي باقي ماندند.
الگوريتم پيشنهادي توانست با ارائه تصاوير بازسازيشده باكيفيت و كارايي بالا، عملكردي قابلقبول در رفع تاري تصاوير ارائه دهد و بهعنوان ابزاري مؤثر براي افزايش ايمني و دقت سيستمهاي بينايي كامپيوتر در صنعت ريلي مطرح شود.
-
تاريخ ورود اطلاعات
1403/09/04
-
عنوان به انگليسي
Design of an Image Processing Algorithm to Reduce Motion Blur in Train Camera Images Using Convolutional Neural Networks
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
حميدرضا حيدرزاده مقدم
-
چكيده به لاتين
Artificial intelligence and computer vision are among the leading technologies of today, playing a pivotal role in enhancing the accuracy and speed of visual data processing across various industries. In the railway industry, these technologies are utilized in autonomous train systems for obstacle detection, signal recognition, and level crossing evaluation. The proper functioning of these systems relies heavily on the quality of input images fed to neural networks, and any degradation in quality can lead to issues such as detection errors, incorrect evaluations, and compromised safety.
In the railway industry, factors such as high train speeds, track conditions, and weather changes like wind and rain cause severe and random vibrations in cameras, resulting in blurred images entering the neural networks. These conditions necessitate an effective solution to maintain the quality of input images. To address this, the DeblurGAN-v2 network with the MobileNet-DSC architecture, known for its effective performance in mitigating mild to moderate motion blur, was selected as the base network.
Considering the complex and random nature of vibrations in the railway industry, targeted modifications were made to the generator architecture of the network. These modifications included increasing the number of convolutional layers to enhance feature extraction, enlarging filter sizes to capture more details, adding Attention layers to focus on critical regions of the image, and optimizing the downsampling and upsampling layers to improve image reconstruction. These adjustments significantly enhanced image quality metrics, such as PSNR and SSIM, while key industrial metrics, including processing time and FLOPS (representing computational operations), remained within industry standards.
The proposed algorithm effectively provided high-quality reconstructed images and demonstrated reliable performance in mitigating motion blur, establishing itself as a practical tool for enhancing the safety and precision of computer vision systems in the railway industry.
-
كليدواژه هاي فارسي
سيستمهاي بينايي كامپيوتر , لرزش دوربين قطار , رفع اغتشاشات لرزشي تصاوير دوربينهاي قطار , شبكههاي عصبي كانولوشنال , شبكه DeblurGAN-v2
-
كليدواژه هاي لاتين
Computer vision systems , train camera vibration , motion blur reduction in train camera images , convolutional neural networks , DeblurGAN-v2 network
-
Author
Hamidreza Heydarzadeh Moghadam
-
SuperVisor
Dr. Bahman Ghorbani Vaghei
-
لينک به اين مدرک :