• شماره ركورد
    8795
  • پديد آورنده

    مرتضي شهرابي فراهاني

  • عنوان
    تفسير مدل آموخته شده براي تشخيص اشيا مبتني بر مبدل‌ها
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي كامپيوتر
  • سال فارغ التحصيلي
    1402
  • استاد راهنما
    دكتر محمدرضا محمدي
  • استاد مشاور
    دكتر محسن سرياني
  • دانشجوي وارد كننده اطلاعات

    مرتضي شهرابي فراهاني

  • تاريخ ورود اطلاعات
    1402/08/01
  • دانشكده
    مهندسي كامپيوتر
  • عنوان به انگليسي
    Explaining the Learned Model for Object Detection Based on Transformers
  • چكيده
    امروزه با توسعه‌ي هوش مصنوعي و يادگيري عميق و بيشتر شدن تاثير آن در زندگي انسان‌ها و همچنين اهميت اين تكنولوژي‌ها در انقلاب صنعتي چهارم، نياز به درك بهتر مدل‌ها و طريقه‌ي تصميم‌گيري در اين مدل‌ها، بيش از پيش حس مي‌شود. يكي از حوز‌ه‌هايي كه امروزه از مدل‌هاي يادگيري عميق در آن استفاده مي‌شود، حوزه‌ي تشخيص اشيا است. تشخيص اشيا عبارت است از شناسايي نوع يك شي و مشخص كردن مكان آن در يك تصوير. البته اين مسئله در گذشته هم وجود داشته و برخي روش‌هاي سنتي پردازش تصوير هم براي آن وجود دارد، اما با گذشت زمان و پيشرفت يادگيري عميق، مدل‌هاي جديدي براي حل اين مسئله ارائه شدند كه يكي از اين مدل‌ها، مبدل‌ها هستند. در پژوهش پيش‌رو، مدل DETR كه يكي از مدل‌هاي مبتني بر مبدل‌ها براي مسئله‌ي تشخيص اشيا است بررسي شده است. در ابتدا ساختار اين مدل بررسي شده و ويژگي‌هاي مهم آن گفته شده است. در ادامه برخي مشكلات اين مدل گفته شده و يك مدل بهبود يافته از اين مدل هم معرفي شده. در بخش‌هاي بعدي، ابتدا شيوه‌هاي مختلف بازنمايي مدل‌هاي مبتني بر مبدل‌ها و همچنين مدل‌هاي تشخيص اشيا بيان شده، و در ادامه روش‌ جديدي براي بازنمايي و تفسير مدل DETR بيان شده و نتايج مربوط به آزمايش‌ها و تحليل‌ها آورده شده‌اند. در نهايت، پس از انجام بررسي‌هاي انجام شده، متوجه تفاوت عملكرد بين object query هاي مختلف مدل شده و برخي از اين موارد از مدل حذف شدند. در ادامه تاثير حذف اين موارد از مدل انجام شده كه طبق نتايج به دست آمده، حذف آن موارد موجب بهبود زمان پردازش مدل و همچنين كم شدن تعداد عمليات‌هاي مدل شده است.
  • كليدواژه ها
    يادگيري عميق , بينايي كامپيوتر , مبدل‌ها , تفسيرپذيري , تشخيص اشيا , Deep learning , Computer vision , Transformer , DETR , Explainability , Object detection