شماره ركورد
11576
عنوان
ترانسفورمر بينايي و كاربردهاي آن در پردازش تصوير
سال تحصيل
1400
استاد راهنما
دكتر شهريار برادران شكوهي
چکيده
ترانسفورمر كه براي اولين بار در زمينه ي پردازش زبان طبيعي (NLP) به كار رفت، نوعي شبكه ي عصبي عميق (DNN) است كه عمدتا بر اساس مكانيسم توجه به خود است. در چند سال گذشته، شبكه هاي عصبي كانولوشنال (CNNs) به عنوان شبكه ي اصلي براي پردازش تصاوير در نظر گرفته شده اند. ترانسفورمر به دليل قابليت ها، عملكرد رقابتي و پتانسيل فوق العاده اي كه در مقايسه با ساير انواع شبكهها مانند شبكههاي عصبي كانولوشنال و بازگشتي (RNNs) دارد، توجه بيشتري را از سوي جامعه ي بينايي كامپيوتر (CV) به خود جلب كرده است. در مقايسه با شبكههاي كانولوشنال و شبكههاي بازگشتي، اين مدل از نظر كيفيت برتر است، موازيسازي قويتري دارد و به زمان آموزش كمتري نياز دارد. به دليل اين مزاياي قدرتمند، استفاده از ترانسفورمر در بينايي كامپيوتر روز به روز در حال گسترش است. ترانسفورمرها كاربردهاي متنوعي در بينايي كامپيوتر، از جمله دسته بندي تصوير، بينايي سطح بالا يا متوسط و بينايي سطح پايين دارند.
در اين سمينار به معرفي قسمت هاي مختلف شبكه ي ترانسفورمر اصلي و مكانيزم توجه به خود پرداخته مي شود و ترانسفورمر بينايي وكاربرد هاي مختلف آن در دسته بندي، تشخيص، تقسيم بندي و غيره مورد بحث قرار خواهد گرفت.
نام دانشجو
نرگس سميرمي زاده
تاريخ ارائه
12/21/2022 12:00:00 AM
متن كامل
77282
پديد آورنده
نرگس سميرمي زاده
تاريخ ورود اطلاعات
1401/10/05
عنوان به انگليسي
Vision Transformer and Image Processing Applications
كليدواژه هاي فارسي
ترانسفورمر، توجه به خود، بينايي كامپيوتر، بينايي سطح بالا، بينايي سطح پايين.
كليدواژه هاي لاتين
Transformer, Self-attention, Computer Vision, High-level vision, Low-level vision