پگاه اشرفي

عنوان

ناوبري مبتني بر فاصله سنجي با استفاده ازشبكه هاي عصبي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي برق- الكترونيك ـ ديجيتال

سال تحصيل

1398

تاريخ دفاع

1402/3/1

استاد راهنما

محمدرضا موسوي ميركلائي

دانشكده

مهندسي برق

چكيده

بسياري از الگوريتم‌هاي فاصله سنجي تصويري موجود تحت يك خط لوله استاندارد توسعه يافته‌اند كه شامل استخراج ويژگي، تطبيق ويژگي، تخمين حركت، بهينه‌سازي محلي و غيره مي‌شوند. اگرچه برخي از آن‌ها عملكرد خوبي از خود نشان داده‌اند، اما معمولا براي كاركرد خوب در محيط‌هاي مختلف نيازبه طراحي و تنظيم دقيق دارند. همچنين، استفاده ازدانش قبلي براي بازيابي مقياس مطلق درروش فاصله سنجي تصويري نيزمورد نيازاست وطبيعتا اين اعمال مستلزم صرف هزينه و زمان زيادي خواهد بود. در اين پايان‌نامه، به بررسي روشي پرداخته‌ايم كه به صورت انتها به انتها آموزش داده شده وموقعيت‌ها را مستقيما از دنباله‌اي از تصاويرRGB خام (ويدئوها) بدون استفاده از هيچ ماژولي در خط لوله فاصله سنجي تصويري معمولي استنباط مي‌كند ونيازي به تنظيم دقيق پارامترهاي سامانه فاصله سنجي تصويري ندارد. روش مورد نظرنه تنها به طور خودكار نمايش ويژگي‌هاي مؤثر براي فاصله سنجي تصويري را از طريق شبكه‌هاي عصبي كانولوشنال مي‌آموزد، بلكه روابط متوالي را با استفاده از شبكه‌هاي عصبي بازگشتي عميق مدل مي‌كند.اين روش يك الگوريتم فاصله سنجي تصويري تك چشمي جديد را براساس يادگيري عميق ارائه مي‌كند بر اساس معيارKITTI، تأييد شده است كه مي‌تواند نتايج فاصله سنجي تصويري دقيقي را با مقياسه‌اي دقي ايجاد كند و درسناريوهاي كاملا جديد به خوبي عمل كند.آزمايش‌هاي گسترده بروي مجموعه داده‌هايKITTI عملكرد رقابتي با روش‌هاي پيشرفته را نشان مي‌دهد و تأييد مي‌كند كه فن يادگيري‌عميق انتها به انتها مي‌تواند مكمل مناسبي براي سامانه‌هاي ادومتري بصري سنتي باشد.

تاريخ ورود اطلاعات

1402/12/26

عنوان به انگليسي

Visual Odmetry Based on Deep Learning

تاريخ بهره برداري

5/21/2024 12:00:00 AM

دانشجوي وارد كننده اطلاعات

پگاه اشرفي

Name: پگاه اشرفي
Author: پگاه اشرفي

چكيده به لاتين

In this paper, we deal with monocular Visual Odometry (VO) problem. Most of existing VO algorithms are developed under a standard pipeline including feature extraction, feature matching, motion estimation, local optimisation, etc. Although some of them have demonstrated superior performance, they usually need to be carefully designed and specifically fine-tuned to work well in different environments. Some prior knowledge is also required to recover an absolute scale for monocular VO. We explain a novel end-to-end framework for monocular VO by using deep Recurrent Convolutional Neural Networks (RCNNs). Since it is trained and deployed in an end-to-end manner, it infers poses directly from a sequence of raw RGB images (videos) without adopting any module in the conventional VO pipeline. Based on the RCNNs, it not only automatically learns effective feature representation for the VO problem through CNNs, but also implicitly models sequential dynamics and relations using deep RNNs. Extensive experiments on the KITTI VO dataset show competitive performance to state-of-the-art methods, verifying that the end-to-end deep learning technique can be a viable complement to the traditional VO systems.

كليدواژه هاي فارسي

فاصله‌سنجي تصويري تك چشمي , يادگيري عميق , شبكه عصبي كانولوشنال بازگشتي

كليدواژه هاي لاتين

Monocular Visual Odometry , Deep Learning , CNN

Author

Pegah Ashrafi

SuperVisor

Dr. Moosavi Mirkolaei

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=30620&Field=0&DTC=6