-
شماره ركورد
30620
-
پديد آورنده
پگاه اشرفي
-
عنوان
ناوبري مبتني بر فاصله سنجي با استفاده ازشبكه هاي عصبي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق- الكترونيك ـ ديجيتال
-
سال تحصيل
1398
-
تاريخ دفاع
1402/3/1
-
استاد راهنما
محمدرضا موسوي ميركلائي
-
دانشكده
مهندسي برق
-
چكيده
بسياري از الگوريتمهاي فاصله سنجي تصويري موجود تحت يك خط لوله استاندارد توسعه يافتهاند كه شامل استخراج ويژگي، تطبيق ويژگي، تخمين حركت، بهينهسازي محلي و غيره ميشوند. اگرچه برخي از آنها عملكرد خوبي از خود نشان دادهاند، اما معمولا براي كاركرد خوب در محيطهاي مختلف نيازبه طراحي و تنظيم دقيق دارند. همچنين، استفاده ازدانش قبلي براي بازيابي مقياس مطلق درروش فاصله سنجي تصويري نيزمورد نيازاست وطبيعتا اين اعمال مستلزم صرف هزينه و زمان زيادي خواهد بود. در اين پاياننامه، به بررسي روشي پرداختهايم كه به صورت انتها به انتها آموزش داده شده وموقعيتها را مستقيما از دنبالهاي از تصاويرRGB خام (ويدئوها) بدون استفاده از هيچ ماژولي در خط لوله فاصله سنجي تصويري معمولي استنباط ميكند ونيازي به تنظيم دقيق پارامترهاي سامانه فاصله سنجي تصويري ندارد. روش مورد نظرنه تنها به طور خودكار نمايش ويژگيهاي مؤثر براي فاصله سنجي تصويري را از طريق شبكههاي عصبي كانولوشنال ميآموزد، بلكه روابط متوالي را با استفاده از شبكههاي عصبي بازگشتي عميق مدل ميكند.اين روش يك الگوريتم فاصله سنجي تصويري تك چشمي جديد را براساس يادگيري عميق ارائه ميكند بر اساس معيارKITTI، تأييد شده است كه ميتواند نتايج فاصله سنجي تصويري دقيقي را با مقياسهاي دقي ايجاد كند و درسناريوهاي كاملا جديد به خوبي عمل كند.آزمايشهاي گسترده بروي مجموعه دادههايKITTI عملكرد رقابتي با روشهاي پيشرفته را نشان ميدهد و تأييد ميكند كه فن يادگيريعميق انتها به انتها ميتواند مكمل مناسبي براي سامانههاي ادومتري بصري سنتي باشد.
-
تاريخ ورود اطلاعات
1402/12/26
-
عنوان به انگليسي
Visual Odmetry Based on Deep Learning
-
تاريخ بهره برداري
5/21/2024 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
پگاه اشرفي
-
چكيده به لاتين
In this paper, we deal with monocular Visual Odometry (VO) problem. Most of existing VO algorithms are developed under a standard pipeline including feature extraction, feature matching, motion estimation, local optimisation, etc. Although some of them have demonstrated superior performance, they usually need to be carefully designed and specifically fine-tuned to work well in different environments. Some prior knowledge is also required to recover an absolute scale for monocular VO. We explain a novel end-to-end framework for monocular VO by using deep Recurrent Convolutional Neural Networks (RCNNs). Since it is trained and deployed in an end-to-end manner, it infers poses directly from a sequence of raw RGB images (videos) without adopting any module in the conventional VO pipeline. Based on the RCNNs, it not only automatically learns effective feature representation for the VO problem through CNNs, but also implicitly models sequential dynamics and relations using deep RNNs. Extensive experiments on the KITTI VO dataset show competitive performance to state-of-the-art methods, verifying that the end-to-end deep learning technique can be a viable complement to the traditional VO systems.
-
كليدواژه هاي فارسي
فاصلهسنجي تصويري تك چشمي , يادگيري عميق , شبكه عصبي كانولوشنال بازگشتي
-
كليدواژه هاي لاتين
Monocular Visual Odometry , Deep Learning , CNN
-
Author
Pegah Ashrafi
-
SuperVisor
Dr. Moosavi Mirkolaei
-
لينک به اين مدرک :