شماره ركورد
34851
پديد آورنده
معصومه رضي پور جويباري
عنوان
تشخيص آسيب جاده با كمك ترنسفورمر و يادگيري نيمه نظارتي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي خودرو
سال تحصيل
1401
تاريخ دفاع
1404/07/28
استاد راهنما
دكتر عبدالله اميرخاني
استاد مشاور
.
دانشكده
مهندسي خودرو
چكيده
تشخيص آسيبهاي جادهاي فرآيندي حياتي در راستاي شناسايي و ارزيابي نواقص و صدمات موجود بر سطح معابر است كه نقش مهمي در ارتقاء ايمني حملونقل، كاهش هزينههاي نگهداري، و پيشگيري از بروز حوادث جادهاي ايفا ميكند. با توجه به گسترش شبكههاي جادهاي و لزوم پايش مستمر وضعيت زيرساختها، استفاده از روشهاي هوشمند و مبتني بر بينايي ماشين براي تشخيص خودكار آسيبهاي جادهاي، بهويژه در محيطهاي شهري، به يكي از چالشهاي كليدي در حوزه هوش مصنوعي و پردازش تصوير تبديل شده است. در اين پژوهش، بهمنظور تهيه دادههاي اختصاصي و واقعي، يك پايگاه داده (ديتاست) از تصاوير معابر شهري شهرستان جويبار گردآوري گرديد. جهت افزايش حجم و تنوع دادهها و ارتقاي توان مدلهاي يادگيري، مجموعهاي از تكنيكهاي دادهافزايي بر روي تصاوير اعمال شد. در ادامه، سه نسخه از مدلهاي قدرتمند YOLO شامل YOLOv5، YOLOv8 و YOLOv10 بر روي دادههاي آمادهشده آموزش داده شدند. نتايج ارزيابي اين مدلها نشان داد كه بهترتيب مدلها توانستند دقتهايي معادل 0.858، 0.696 و 0.882 را در معيار mAP@0.5 كسب كنند كه نشان از توانايي بالاي مدل YOLOv10 در تشخيص دقيق آسيبهاي جادهاي دارد. در گام بعدي، با هدف بهرهگيري از دادههاي بدون برچسب و كاهش نياز به دادههاي دستي برچسبخورده، از روش يادگيري نيمهنظارتي استفاده شد. نتايج بهدستآمده از اين مرحله نشان داد كه تركيب دادههاي برچسبخورده و بدون برچسب موجب بهبود عملكرد مدل شده و دقت آن را در معيار mAP@0.5 به 0.799 افزايش داده است. در نهايت، براي دستيابي به مدلي بهينه با عملكرد بالاتر، از معماري پيشنهادي جديدي تحت عنوان C3TR بهره گرفته شد كه تركيبي از قابليتهاي مدل YOLOv5 و ساختار ترنسفورمر ميباشد. اين مدل، با بهرهمندي از مكانيزم توجه موجود در ساختار ترنسفورمر، توانست عملكرد قابلتوجهي در تشخيص آسيبهاي جادهاي ارائه دهد و دقتي برابر با 0.858 در معيار mAP@0.5 كسب نمايد. نتايج اين تحقيق نشان ميدهد كه تركيب ساختارهاي پيشرفته يادگيري عميق، بهويژه مدلهاي مبتني بر توجه، با معماريهاي شناسايي شيء مانند YOLO، ميتواند بهطور چشمگيري كارايي سيستمهاي تشخيص آسيب جادهاي را افزايش دهد و گامي مؤثر در جهت توسعه راهكارهاي هوشمند نگهداري معابر شهري باشد.
تاريخ ورود اطلاعات
1404/09/24
عنوان به انگليسي
Road damage detection using transformers and semi-supervised learning
تاريخ بهره برداري
10/20/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
معصومه رضي پورجويباري
چكيده به لاتين
Road damage detection is a vital process for identifying and assessing existing defects and damages on road surfaces, which plays an important role in improving transportation safety, reducing maintenance costs, and preventing road accidents. Given the expansion of road networks and the need for continuous monitoring of infrastructure conditions, the use of intelligent and machine vision-based methods for automatic detection of road damage, especially in urban environments, has become one of the key challenges in the field of artificial intelligence and image processing. In this study, in order to provide specific and real data, a database (dataset) of images of urban roads in Jouybar County was collected. In order to increase the volume and diversity of data and improve the power of learning models, a set of data augmentation techniques were applied to the images. Subsequently, three versions of powerful YOLO models, including YOLOv5, YOLOv8, and YOLOv10, were trained on the prepared data. The evaluation results of these models showed that the models were able to achieve accuracies of 0.858, 0.696, and 0.882 in the mAP@0.5 criterion, respectively, which indicates the high ability of the YOLOv10 model in accurately detecting road damage. In the next step, with the aim of utilizing unlabeled data and reducing the need for manually labeled data, the semi-supervised learning method was used. The results obtained from this step showed that combining labeled and unlabeled data improved the performance of the model and increased its accuracy in the mAP@0.5 criterion to 0.799. Finally, to achieve an optimal model with higher performance, a new proposed architecture called C3TR was used, which is a combination of the capabilities of the YOLOv5 model and the transformer structure. This model, by utilizing the attention mechanism in the transformer structure, was able to provide significant performance in road damage detection and achieved an accuracy of 0.858 in the mAP@0.5 criterion. The results of this research show that combining advanced deep learning structures, especially attention-based models, with object recognition architectures such as YOLO can significantly increase the efficiency of road damage detection systems and be an effective step towards developing smart urban road maintenance solutions.
كليدواژه هاي فارسي
تشخيص آسيب جاده , ماشين لرنينگ , ترنسفورمر , يادگيري نيمه نظارتي
كليدواژه هاي لاتين
Road damage detection , machine learning , Transformer , Semi-supervised learning
Author
Masoumeh Razi Pour Juybari
SuperVisor
Dr. Abdollah Amirkhani