شماره ركورد
33728
پديد آورنده
اميرمحمد خادم حسيني
عنوان
پياده ساز ي زمان واقعي تقسيم بندي معنايي بر FPGA براي خودرو ها ي خودران
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق- الكترونيك ـ ديجيتال
سال تحصيل
1401
تاريخ دفاع
1404/6/31
استاد راهنما
ستار ميرزاكوچكي
استاد مشاور
-
دانشكده
پرديس دانشگاهي - دانشكده مهندسي برق
چكيده
در سالهاي اخير، تقسيمبندي معنايي بهعنوان يكي از مسائل بنيادين بينايي ماشين جايگاه ويژهاي در كاربردهاي بلادرنگ از جمله خودروهاي خودران يافته است. چالش اصلي در اين حوزه، دستيابي به دقت بالا در كنار محدوديتهاي محاسباتي و سختافزاري است. در اين پژوهش، يك معماري سبك و كارا مبتني بر شبكه LMIINet با بهرهگيري از آموزش آگاه از كمّيسازي و كتابخانهي QKeras آموزش داده شد و سپس بر روي سختافزار FPGA با استفاده از چارچوب CGRA4ML پيادهسازي گرديد و مجموعه دادهي Cityscapes بهعنوان مرجع براي آموزش و ارزيابي انتخاب شد. در جريان اين كار، تغييرات لازم براي سازگاري مدل با محدوديتهاي CGRA4ML اعمال گرديد؛ از جمله سادهسازي اتصالات ميانبُر، استفاده از عمليات سختافزارپسند (مانند كانولوشنهاي عمقي - تفكيكي و 1×1)، و طراحي مجدد بخشهايي از Flatten Transformer. همچنين تماميلايهها به 8 بيتي كوانتيزه شدند تا ضمن كاهش چهاربرابري ردپاي حافظه، محاسبات صحيح عددي كارا بر روي FPGA انجام گيرد. نتايج نشان داد با دقت پيكسلي حدود 90 درصد و mIoU 45 درصد قادر به اجراي بلادرنگ با نرخ 20 فريم بر ثانيه (تاخير 50.104 ms) بر روي برد ZCU104 است. اين پژوهش نشان ميدهد كه چارچوب CGRA4ML، با انعطافپذيري در نگاشت لايههاي مدرن و بهرهگيري از حافظهي خارجتراشه براي اتصالات ميانبُر، گزينهاي عملي براي اجراي شبكههاي پيشرفتهي تقسيم بندي معنايي و ديگر مدل هاي هوشمند بر روي FPGA در كاربردهاي بلادرنگ است، اما براي انتخاب مدل تقسيم بندي معنايي متناسب با پياده سازي CGRA4ML تغييرات بيشتر بايد انجام بگيرد تا عملكرد مدل بهينه تر باشد.
تاريخ ورود اطلاعات
1404/07/13
عنوان به انگليسي
Real-time semantic segmentation implementation on FPGA for autonomous vehicles
تاريخ بهره برداري
9/22/2025 12:00:00 AM
دانشجوي وارد كننده اطلاعات
اميرمحمد خادم حسيني
چكيده به لاتين
In recent years, semantic segmentation has emerged as one of the fundamental problems in computer vision, gaining particular importance in real-time applications such as autonomous driving. The main challenge in this field is achieving high accuracy while operating under computational and hardware constraints. In this research, a lightweight and efficient architecture based on the LMIINet network was trained using quantization-aware training (QAT) with the QKeras library, and then implemented on FPGA hardware using the CGRA4ML framework. The Cityscapes dataset was selected as the reference for training and evaluation. During this work, the necessary modifications were applied to adapt the model to CGRA4ML constraints, including simplifying skip connections, employing hardware-friendly operations (such as depthwise-separable and 1×1 convolutions), and redesigning parts of the Flatten Transformer. Furthermore, all layers were quantized to 8-bit precision, which not only reduced the memory footprint by a factor of four but also enabled efficient fixed-point computations on FPGA. The results demonstrated that with approximately 90% pixel accuracy and 45% mIoU, the model can operate in real-time at 20 frames per second (50.104 ms latency) on the ZCU104 board. This research shows that CGRA4ML, with its flexibility in mapping modern layers and its use of off-chip memory for skip connections, is a practical option for implementing advanced semantic segmentation networks and other intelligent models on FPGA in real-time applications. However, additional modifications are required to further adapt semantic segmentation models for CGRA4ML deployment in order to optimize performance.
كليدواژه هاي فارسي
تقسيمبندي معنايي , آرايهي دروازهي ميداني برنامهپذير , كوانتيزاسيون
كليدواژه هاي لاتين
Semantic Segmentation , FPGA , Quantization
Author
Amir Mohammad Khadem Hoseini
SuperVisor
Dr Sattar Mirza Kochaki