شماره ركورد
34394
پديد آورنده
وحيد رحيمي بافراني
عنوان
ارائه سيستم پاركينگ هوشمند مبتني بر يادگيري عميق و پردازش تصوير با استفاده از تصاوير هوايي پهپادهاي تجاري
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق-سيستم هاي الكترونيك ديجيتال
سال تحصيل
1401
تاريخ دفاع
1404/07/28
استاد راهنما
دكتر احمد آيت اللهي
استاد مشاور
دكتر افشين شريعت مهيمني
دانشكده
مهندسي برق
چكيده
اين پژوهش يك سامانه يكپارچه بينايي محور براي مديريت هوشمند پاركينگ اتوبوسها در پايانه بركت (شهر مهران) ارائه ميكند كه هدف آن تشخيص جايگاههاي خالي و هدايت اتوبوسها به نزديكترين جايگاه آزاد است. ورودي سامانه، ويدئوهاي پهپادي با نماي كلي از پاركينگ است كه پس از پالايش و گزينش، براي آموزش و ارزيابي به كار رفتهاند. خط لوله پيشنهادي شامل: (1) آشكارسازي اتوبوسها با استفاده از مدل هاي تشخيص شي از خانواده YoLo با خروجي OBB و استفاده از ابزار SAHI براي قطعهبندي پنجرهاي تصاوير بزرگ (پنجره 640 پيكسلي با همپوشاني 20%)، (2) بازسازي هندسه صحنه با ماتريس هموگرافي و نگاشت برچسبهاي قاب مرجع به قاب جاري، (3) برآورد وضعيت اشغال هر جايگاه بر پايه نسبت پوشيدگي چند ضلعي جايگاه به ماسك اتوبوسها (با استفاده از انبساط مورفولوژيك) و آستانه تصميمگيري 0.1 و (4) مسيريابي مبتني بر الگوريتم *A رو شبكه هزينه با در نظر گرفتن هزينه چرخش. مجموعه داده آموزشي از 695 تصوير برچسب خورده تشكيل شد كه با چرخس 15 درجه، تغيير روشنايي و افزودن نويز تصادفي به 1395 تصوير افزايش يافت. همچنين براي ارزيابي نگاشت هندسي، 4 تصوير به صورت كامل برچسب گذاري شدند. در مقايسه مدلها، YoLO v8 large بهترين mAP@[50-95] = 0.91 را ارائه داد؛ در عين حال، YoLo v11 small و YoLo v11 medium به ترتيب به 0.901 و 0.905رسيدند. از منظر سرعت، كمترين زمان استنتاج روي GPU مربوط به مدل YoLo v8 Nano و كمترين زمان روي CPU مربوط به مدل YoLo v12 Nano بدست آمد. در مرحله همترازي، تركيب CLAHEبا استخراج ويژگي KAZE بالاترين ميانگين IoU را در نگاشت برچسبها رقم زد، در حاليكه براي كلاس «جاده» تركيب HE و RootSift برتر بود.
تاريخ ورود اطلاعات
1404/10/30
عنوان به انگليسي
An intelligent parking system based on deep learning and image processing using commercial drones aerial images
تاريخ بهره برداري
1/19/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
وحيد رحيمي بافراني
چكيده به لاتين
This study presents an integrated vision-based system for intelligent bus parking management at the Barekat terminal (Mehran city), aimed at detecting vacant bays and guiding buses to the nearest available spot. The system input consists of drone-captured videos providing an overhead view of the parking area, which, after refinement and selection, were employed for training and evaluation. The proposed pipeline comprises four main stages: (1) bus detection using the YOLOv8/11/12 families with Oriented Bounding Box (OBB) outputs and the application of SAHI for window-based tiling of large images (640-pixel windows with 20% overlap), (2) scene geometry reconstruction via a homography matrix and mapping of reference-frame labels onto the current frame, (3) occupancy estimation of each bay based on the overlap ratio between the bay polygon and the dilated bus mask (employing morphological dilation) with a decision threshold of 0.10, and (4) cost-aware path planning using the A* algorithm on a cost grid, incorporating turning costs. The training dataset comprised 695 annotated images, which were expanded to 1,359 images through data augmentation techniques including 15° rotations, brightness variations, and the addition of random noise. Additionally, four fully annotated images were prepared for evaluating geometric alignment. Among the tested models, YOLOv8-Large achieved the best performance with mAP@[50:95] ≈ 0.911; meanwhile, YOLOv11-Small and YOLOv11-Medium reached approximately 0.901 and 0.905, respectively. In terms of inference speed, YOLOv8-Nano demonstrated the lowest runtime on GPU, while YOLOv12-Nano achieved the lowest runtime on CPU. The highest precision was obtained with YOLOv11-Nano. In the alignment stage, the combination of CLAHE preprocessing with KAZE feature extraction achieved the highest mean IoU for label mapping, whereas for the “road” class, the combination of histogram equalisation (HE) with RootSIFT yielded superior performance.
كليدواژه هاي فارسي
ناوبري بصري , پاركينگ هوشمند , يادگيري عميق , پردازش تصوير , تصاوير هوايي
كليدواژه هاي لاتين
Visual Navigation , Inteligent Parking , Deep learning , Image Processing , Arial Images
Author
Vahid Rahimi Bafrani
SuperVisor
Dr. Ahmad Ayatollahi