شماره ركورد
34674
پديد آورنده
محمود اسكندر
عنوان
بهود دقت و كارايي محاسباتي در مكان يابي بصري با استفاده از معماري هاي بهينه شده ي يادگيري عميق
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق الكترونيك - مدار هاي مجتمع
سال تحصيل
1402
تاريخ دفاع
1404/10/30
استاد راهنما
دكتر سيد محمدرضا موسوي ميركلايي - دكتر ستار ميرزاكوچكي
استاد مشاور
ندارد
دانشكده
برق
چكيده
مكان يابي بصري و نقشهبرداري، از جمله چالشهاي كليدي در حوزه رباتيك و ناوبري خودمختار هستند. سامانههاي SLAM (مكان يابي و نقشهبرداري همزمان)، با هدف تعيين مسير حركت دوربين و بازسازي ساختار محيط به صورت برخط، توسعه يافتهاند، اما روشهاي سنتي، اغلب در برابر تغييرات نوري، بافتهاي پيچيده و حركتهاي سريع دوربين، حساس هستند. در اين پژوهش، چارچوبي نوين براي مكان يابي بصري و بازسازي سهبعدي صحنه، ارائه شده است كه تركيبي از شبكههاي عصبي عميق و بهينهسازي هندسي دستهاي ميباشد. در روش پيشنهادي، دو شبكه عصبي مستقل براي استخراج ويژگيهاي تطبيقي، توسعه يافته است و با بهرهگيري از مكانيزم Self-Attention و نمونهبرداري چندمقياسي، بازنماييهاي مقاوم و دقيقي از حركت و ساختار محيط، فراهم گرديده است. دادههاي ورودي، شامل تواليهاي تصويري با اطلاعات عمق و موقعيت دقيق هستند و فرآيند آموزش به صورت نظارتشده با الگوريتم AdamW انجام شده است. سامانهي پيشنهادي، با استفاده از تركيبي از Python، ++C و CUDA، امكان پردازش مؤثر و برخط فريمهاي طولاني با نرخ بالا را فراهم ميكند. كارآيي روش پيشنهادي بر روي مجموعهدادههاي شبيهسازي EuRoC MAV و همچنين دادههاي واقعي جمعآوريشده توسط دوربين iPhone، ارزيابي گرديد. نتايج كمي بر اساس ATE و تحليل كيفي مسيرهاي بازسازيشده، نشاندهنده دقت بالاتر، پايداري بيشتر و قابليت تعميم بهتر نسبت به روشهاي مرجع ميباشد. اين پژوهش، تأكيد ميكند كه ادغام يادگيري عميق با بهينهسازي هندسي، رويكردي كارآمد، مقاوم و قابل اعتماد براي حل مسائل جريان نوري و بازسازي سهبعدي، ارائه ميدهد و پتانسيل بالايي براي كاربردهاي عملي در رباتيك، واقعيت افزوده و ناوبري بصري دارد.
تاريخ ورود اطلاعات
1405/01/25
عنوان به انگليسي
improving the accuracy and computational efficiency of visual navigation using deep learning algorithms
تاريخ بهره برداري
1/20/2027 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محمود اسكندر
چكيده به لاتين
visual navigation and mapping are key challenges in the field of robotics and autonomous navigation .SLAM ( simultaneous mapping and mapping ) have been developed to determine the direction of camera movement and to restore the structure of the environment , but traditional methods are often sensitive to optical changes , complex tissues , and fast - camera movements . in this research , a new framework for visual locating and 3 d reconstruction of the scene is presented which combines deep neural networks and geometric optimization of hands .in the proposed method , two independent neural networks have been developed to extract adaptive features and by using self - affine and multiscale sampling , robust and accurate representations of motion and structure of the environment have been provided .input data , including image sequences with depth information and exact location , and the training process is supervised by AdamW algorithm . using a combination of python , + + c and CUDA , the proposed system allows efficient and online processing of long - term frames with high rate . the efficiency of the proposed method was evaluated on EuRoC EuRoC simulation and real data collected by the iphone camera .quantitative results based on ATE and qualitative analysis of reconstructed paths show higher accuracy , higher stability and better generalization ability than reference methods .this research emphasizes that the integration of deep learning by geometric optimization offers an efficient , robust and reliable approach to solve optical flow problems and 3 - d reconstruction and has a high potential for practical applications in robotics , augmented reality and visual navigation .
كليدواژه هاي فارسي
ناوبري , مكان يابي و نقشه برداري همزمان , مكان يابي بصري , يادگيري عميق
كليدواژه هاي لاتين
navigation , SLAM , visual navigation , deep learning
Author
mahmoud eskandar
SuperVisor
Dr. Seyed Mohammadreza Mousavi mirkolaei - Dr. Sattar Mirzakuchaki