• شماره ركورد
    31648
  • پديد آورنده

    سيد محمد حسيني پناه

  • عنوان
    ‫ﺛﺒﺖ‬‫ﺗﺼﻮﯾﺮ‬ ‫ﺳﻨﺠﺶ‬ ‫ﺍﺯ‬ ‫ﺩﻭﺭ‬ ‫ﭼﻨﺪ‬ ‫ﺯﻣﺎﻧﯽ‬ ‫ﺑﺎ‬ ‫ﺍﺳﺘﻔﺎﺩﻩ‬ ‫ﺍﺯ‬ ‫ﺷﺒﮑﻪ‬‫ﻫﺎﯼ‬‫ﻋﺼﺒﯽ‬ ‫ﻋﻤﯿﻖ‬ ‫ﻭ‬ ‫ﻧﻮﺍﺣﯽ‬ ‫ﻣﻮﺭﺩ‬ ‫ﻋﻼﻗﻪ‬
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر-هوش مصنوعي و رباتيكز
  • سال تحصيل
    1399
  • تاريخ دفاع
    1402/12/24
  • استاد راهنما
    دكتر محسن سرياني
  • استاد مشاور
    دكتر محمد رضا محمدي
  • دانشكده
    كامپيوتر
  • چكيده
    هدف از ثبت تصوير، تراز كردن دو يا چند تصوير است كه از يك صحنه، در زمان‌هاي مختلف و/يا از ديدگاه‌هاي مختلف و/يا با استفاده از دستگاه هاي مختلف گرفته شده است. در سال‌هاي اخير با بهبود مستمر توانايي انسان در رصد زمين، دقت و كيفيت تصاوير سنجش از دور افزايش يافته است. بنابراين نياز به مدل‌هاي جديد ثبت تصوير كه بتواند محاسبات بالاي اين تصاوير را انجام دهد و همچنين از دقت خوبي برخوردار باشد، مشاهده مي‌شود. در اين پايان‌نامه، ما از يك روش جديد براي حل اين مشكلات استفاده كرده‌ايم. راه‌حل پيشنهادي شامل استفاده از نواحي مورد علاقه به منظور كاهش ناحيه جست‌و‌جو و افزايش دقت است. براي اين منظور ابتدا ناحيه‌هايي كه بين دو تصوير يكسان هستند، شناسايي مي‌شوند و سپس، ثبت تصوير با توجه به ناحيه‌هاي مشابه صورت مي‌گيرد. براي پيدا كردن ناحيه مورد علاقه، از يك مدل شبكه عصبي عميق ترانسفورمر استفاده شده است. شبكه عصبي عميق ترانسفورمر پيشنهادي شامل چندين لايه توجه دروني و توجه متقاطع است كه وظيفه يادگيري اهميت موقعيت‌هاي مختلف در درون يك تصوير و بين دو تصوير را دارد. مدل پيشنهادي يك مدل خودنظارتي است كه از روش تعويض بخش براي توليد داده‌هاي آموزشي استفاده مي‌كند. داده‌هاي آموزشي، از تصاوير Google Earth جمع‌آوري شده است و توسط مانشانه‌گذاري شده‌است. پس از آموزش مدل و بدست آوردن ناحيه‌هاي مشابه، از ويژگي‌هاي SIFT براي ثبت تصوير استفاده مي‌كنيم. براي آزمايش، از تصاوير هوايي Sentinel-2 استفاده كرده‌ايم. براي ارزيابي كمي نتيجه، ما از ريشه ميانگين مربعات خطا استفاده مي‌كنيم. نتايج كمي و كيفي نشان دهنده شكاف عملكرد قابل توجهي در هزينه و دقت، در مقايسه با روش استفاده از ويژگي‌هاي SIFT و نيز يك روش مبتني برشبكه عصبي عميق براي ثبت تصاوير هوايي است؛ بطوري كه ميانگين خطاي ثبت تصاوير بر حسب پيكسل 3.5 برابر نسبت به مدل SIFT و 17 برابر نسبت به مدل شبكه عصبي عميق كاهش داشته است.
  • تاريخ ورود اطلاعات
    1403/09/14
  • عنوان به انگليسي
    Multi-Temporal Remote Sensing Image Registration with Deep Neural Networks and Region of Interest
  • تاريخ بهره برداري
    1/1/1900 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    سيدمحمد حسيني پناه

  • چكيده به لاتين
    The purpose of image registration is to align two or more images taken from the same scene at different times and/or from different perspectives and/or using different devices. In recent years, with the continuous improvement of human ability to observe the earth, the accuracy and quality of remote sensing images have increased. Therefore, the need for new image registration models that can perform high calculations of these images and also have good accuracy is observed. In this thesis, we have used a new method to solve these problems. The proposed solution includes the use of regions of interest in order to reduce the search area and increase the accuracy. For this purpose, first, the areas that are the same between two images are identified, and then, the image is registered according to the similar areas. To find the region of interest, a deep transformer neural network model is used. The proposed deep neural network of the transformer includes several layers of inner-attention and cross-attention, which has the task of learning the importance of different positions within an image and between two images. The proposed model is a self- supervised method that generate training data using the segment swapping. The training data was collected from Google Earth images and annotated by us. After training the model and obtaining the similar regions, we use the common SIFT model to obtain the image registration. For testing, we have used Sentinel-2 aerial images. To quantitatively eva‎luate the result, we use the root mean square error. Quantitative and qualitative results show a significant performance gap in cost and accuracy, compared to conventional methods of capturing aerial images.
  • كليدواژه هاي فارسي
    ‫ﺳﻨﺠﺶ‬ ‫ﺍﺯ‬ ‫ﺩﻭﺭ‬ , ‫ﺗﻄﺒﯿﻖ‬ ‫ﺗﺼﻮﯾﺮ‬ , ‫ﻧﺎﺣﯿﻪ‬ ‫ﻣﻮﺭﺩ‬ ‫ﻋﻼﻗﻪ‬ , شبكه عصبي عميق ترانسفورمر
  • كليدواژه هاي لاتين
    Remote Sensing , Image Registration , Region of Interest , Transformer Deep Neural Network
  • Author
    seyed mohammad hoseini panah
  • SuperVisor
    mohsen soryani