• شماره ركورد
    33728
  • پديد آورنده

    اميرمحمد خادم حسيني

  • عنوان
    پياده ساز ي زمان واقعي تقسيم بندي معنايي بر FPGA براي خودرو ها ي خودران
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق- الكترونيك ـ ديجيتال
  • سال تحصيل
    1401
  • تاريخ دفاع
    1404/6/31
  • استاد راهنما
    ستار ميرزاكوچكي
  • استاد مشاور
    -
  • دانشكده
    پرديس دانشگاهي - دانشكده مهندسي برق
  • چكيده
    در سال‌هاي اخير، تقسيم‌بندي معنايي به‌عنوان يكي از مسائل بنيادين بينايي ماشين جايگاه ويژه‌اي در كاربردهاي بلادرنگ از جمله خودروهاي خودران يافته است. چالش اصلي در اين حوزه، دستيابي به دقت بالا در كنار محدوديت‌هاي محاسباتي و سخت‌افزاري است. در اين پژوهش، يك معماري سبك و كارا مبتني بر شبكه LMIINet با بهره‌گيري از آموزش آگاه از كمّي‌سازي و كتابخانه‌ي QKeras آموزش داده شد و سپس بر روي سخت‌افزار FPGA با استفاده از چارچوب CGRA4ML پياده‌سازي گرديد و مجموعه ‌داده‌ي Cityscapes به‌عنوان مرجع براي آموزش و ارزيابي انتخاب شد. در جريان اين كار، تغييرات لازم براي سازگاري مدل با محدوديت‌هاي CGRA4ML اعمال گرديد؛ از جمله ساده‌سازي اتصالات ميان‌بُر، استفاده از عمليات سخت‌افزارپسند (مانند كانولوشن‌هاي عمقي - تفكيكي و 1×1)، و طراحي مجدد بخش‌هايي از Flatten Transformer. همچنين تمامي‌لايه‌ها به 8 بيتي كوانتيزه شدند تا ضمن كاهش چهاربرابري ردپاي حافظه، محاسبات صحيح ‌عددي كارا بر روي FPGA انجام گيرد. نتايج نشان داد با دقت پيكسلي حدود 90 درصد و mIoU 45 درصد قادر به اجراي بلادرنگ با نرخ 20 فريم بر ثانيه (تاخير 50.104 ms) بر روي برد ZCU104 است. اين پژوهش نشان مي‌دهد كه چارچوب CGRA4ML، با انعطاف‌پذيري در نگاشت لايه‌هاي مدرن و بهره‌گيري از حافظه‌ي خارج‌تراشه براي اتصالات ميان‌بُر، گزينه‌اي عملي براي اجراي شبكه‌هاي پيشرفته‌ي تقسيم‌ بندي معنايي و ديگر مدل هاي هوشمند بر روي FPGA در كاربردهاي بلادرنگ است، اما براي انتخاب مدل تقسيم بندي معنايي متناسب با پياده سازي CGRA4ML تغييرات بيشتر بايد انجام بگيرد تا عملكرد مدل بهينه تر باشد.
  • تاريخ ورود اطلاعات
    1404/07/13
  • عنوان به انگليسي
    Real-time semantic segmentation implementation on FPGA for autonomous vehicles
  • تاريخ بهره برداري
    9/22/2025 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    اميرمحمد خادم حسيني

  • چكيده به لاتين
    In recent years, semantic segmentation has emerged as one of the fundamental problems in computer vision, gaining particular importance in real-time applications such as autonomous driving. The main challenge in this field is achieving high accuracy while operating under computational an‎d hardware constraints. In this research, a lightweight an‎d efficient architecture based on the LMIINet network was trained using quantization-aware training (QAT) with the QKeras library, an‎d then implemented on FPGA hardware using the CGRA4ML framework. The Cityscapes dataset was selec‎ted as the reference for training an‎d eva‎luation. During this work, the necessary modifications were applied to adapt the model to CGRA4ML constraints, including simplifying skip connections, employing hardware-friendly operations (such as depthwise-separable an‎d 1×1 convolutions), an‎d redesigning parts of the Flatten Transformer. Furthermore, all layers were quantized to 8-bit precision, which not only reduced the memory footprint by a factor of four but also enabled efficient fixed-point computations on FPGA. The results demonstrated that with approximately 90% pixel accuracy an‎d 45% mIoU, the model can operate in real-time at 20 frames per second (50.104 ms latency) on the ZCU104 board. This research shows that CGRA4ML, with its flexibility in mapping modern layers an‎d its use of off-chip memory for skip connections, is a practical option for implementing advanced semantic segmentation networks an‎d other intelligent models on FPGA in real-time applications. However, additional modifications are required to further adapt semantic segmentation models for CGRA4ML deployment in order to optimize performance.
  • كليدواژه هاي فارسي
    تقسيم‌بندي معنايي , آرايه‌ي دروازه‌ي ميداني برنامه‌پذير , كوانتيزاسيون
  • كليدواژه هاي لاتين
    Semantic Segmentation , FPGA , Quantization
  • Author
    Amir Mohammad Khadem Hoseini
  • SuperVisor
    Dr Sattar Mirza Kochaki