• شماره ركورد
    34394
  • پديد آورنده

    وحيد رحيمي بافراني

  • عنوان
    ارائه سيستم پاركينگ هوشمند مبتني بر يادگيري عميق و پردازش تصوير با استفاده از تصاوير هوايي پهپادهاي تجاري
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق-سيستم هاي الكترونيك ديجيتال
  • سال تحصيل
    1401
  • تاريخ دفاع
    1404/07/28
  • استاد راهنما
    دكتر احمد آيت اللهي
  • استاد مشاور
    دكتر افشين شريعت مهيمني
  • دانشكده
    مهندسي برق
  • چكيده
    اين پژوهش يك سامانه يكپارچه بينايي محور براي مديريت هوشمند پاركينگ اتوبوس‌ها در پايانه بركت (شهر مهران) ارائه مي‌كند كه هدف آن تشخيص جايگاه‌هاي خالي و هدايت اتوبوس‌ها به نزديك‌ترين جايگاه آزاد است. ورودي سامانه، ويدئو‌هاي پهپادي با نماي كلي از پاركينگ است كه پس از پالايش و گزينش، براي آموزش و ارزيابي به كار رفته‌اند. خط لوله پيشنهادي شامل: (1) آشكارسازي اتوبوس‌ها با استفاده از مدل هاي تشخيص شي از خانواده YoLo با خروجي OBB و استفاده از ابزار SAHI براي قطعه‌بندي پنجره‌اي تصاوير بزرگ (پنجره 640 پيكسلي با همپوشاني 20%)، (2) بازسازي هندسه صحنه با ماتريس هموگرافي و نگاشت برچسب‌هاي قاب مرجع به قاب جاري، (3) برآورد وضعيت اشغال هر جايگاه بر پايه نسبت پوشيدگي چند ضلعي جايگاه به ماسك اتوبوس‌ها (با استفاده از انبساط مورفولوژيك) و آستانه تصميم‌گيري 0.1 و (4) مسيريابي مبتني بر الگوريتم *A رو شبكه هزينه با در نظر گرفتن هزينه چرخش. مجموعه داده آموزشي از 695 تصوير برچسب خورده تشكيل شد كه با چرخس 15 درجه، تغيير روشنايي و افزودن نويز تصادفي به 1395 تصوير افزايش يافت. همچنين براي ارزيابي نگاشت هندسي، 4 تصوير به صورت كامل برچسب گذاري شدند. در مقايسه مدل‌ها، YoLO v8 large بهترين mAP@[50-95] = 0.91 را ارائه داد؛ در عين حال، YoLo v11 small و YoLo v11 medium به ترتيب به 0.901 و 0.905رسيدند. از منظر سرعت، كمترين زمان استنتاج روي GPU مربوط به مدل YoLo v8 Nano و كمترين زمان روي CPU مربوط به مدل YoLo v12 Nano بدست آمد. در مرحله همترازي، تركيب CLAHEبا استخراج ويژگي KAZE بالاترين ميانگين IoU را در نگاشت برچسب‌ها رقم زد، در حاليكه براي كلاس «جاده» تركيب HE و RootSift برتر بود.
  • تاريخ ورود اطلاعات
    1404/10/30
  • عنوان به انگليسي
    An intelligent parking system based on deep learning an‎d image processing using commercial drones aerial images
  • تاريخ بهره برداري
    1/19/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    وحيد رحيمي بافراني

  • چكيده به لاتين
    This study presents an integrated vision-based system for intelligent bus parking management at the Barekat terminal (Mehran city), aimed at detecting vacant bays an‎d guiding buses to the nearest available spot. The system input consists of drone-captured videos providing an overhead view of the parking area, which, after refinement an‎d selec‎tion, were employed for training an‎d eva‎luation. The proposed pipeline comprises four main stages: (1) bus detection using the YOLOv8/11/12 families with Oriented Bounding Box (OBB) outputs an‎d the application of SAHI for window-based tiling of large images (640-pixel windows with 20% overlap), (2) scene geometry reconstruction via a homography matrix an‎d mapping of reference-frame labels onto the current frame, (3) occupancy estimation of each bay based on the overlap ratio between the bay polygon an‎d the dilated bus mask (employing morphological dilation) with a decision threshold of 0.10, an‎d (4) cost-aware path planning using the A* algorithm on a cost grid, incorporating turning costs. The training dataset comprised 695 annotated images, which were expan‎ded to 1,359 images through data augmentation techniques including 15° rotations, brightness variations, an‎d the addition of ran‎dom noise. Additionally, four fully annotated images were prepared for eva‎luating geometric alignment. Among the tested models, YOLOv8-Large achieved the best performance with mAP@[50:95] ≈ 0.911; meanwhile, YOLOv11-Small an‎d YOLOv11-Medium reached approximately 0.901 an‎d 0.905, respectively. In terms of inference speed, YOLOv8-Nano demonstrated the lowest runtime on GPU, while YOLOv12-Nano achieved the lowest runtime on CPU. The highest precision was obtained with YOLOv11-Nano. In the alignment stage, the combination of CLAHE preprocessing with KAZE feature extraction achieved the highest mean IoU for label mapping, whereas for the “road” class, the combination of histogram equalisation (HE) with RootSIFT yielded superior performance.
  • كليدواژه هاي فارسي
    ناوبري بصري , پاركينگ هوشمند , يادگيري عميق , پردازش تصوير , تصاوير هوايي
  • كليدواژه هاي لاتين
    Visual Navigation , Inteligent Parking , Deep learning , Image Processing , Arial Images
  • Author
    Vahid Rahimi Bafrani
  • SuperVisor
    Dr. Ahmad Ayatollahi