-
شماره ركورد
11576
-
عنوان
ترانسفورمر بينايي و كاربردهاي آن در پردازش تصوير
-
سال تحصيل
1400
-
استاد راهنما
دكتر شهريار برادران شكوهي
-
چکيده
ترانسفورمر كه براي اولين بار در زمينه ي پردازش زبان طبيعي (NLP) به كار رفت، نوعي شبكه ي عصبي عميق (DNN) است كه عمدتا بر اساس مكانيسم توجه به خود است. در چند سال گذشته، شبكه هاي عصبي كانولوشنال (CNNs) به عنوان شبكه ي اصلي براي پردازش تصاوير در نظر گرفته شده اند. ترانسفورمر به دليل قابليت ها، عملكرد رقابتي و پتانسيل فوق العاده اي كه در مقايسه با ساير انواع شبكهها مانند شبكههاي عصبي كانولوشنال و بازگشتي (RNNs) دارد، توجه بيشتري را از سوي جامعه ي بينايي كامپيوتر (CV) به خود جلب كرده است. در مقايسه با شبكههاي كانولوشنال و شبكههاي بازگشتي، اين مدل از نظر كيفيت برتر است، موازيسازي قويتري دارد و به زمان آموزش كمتري نياز دارد. به دليل اين مزاياي قدرتمند، استفاده از ترانسفورمر در بينايي كامپيوتر روز به روز در حال گسترش است. ترانسفورمرها كاربردهاي متنوعي در بينايي كامپيوتر، از جمله دسته بندي تصوير، بينايي سطح بالا يا متوسط و بينايي سطح پايين دارند.
در اين سمينار به معرفي قسمت هاي مختلف شبكه ي ترانسفورمر اصلي و مكانيزم توجه به خود پرداخته مي شود و ترانسفورمر بينايي وكاربرد هاي مختلف آن در دسته بندي، تشخيص، تقسيم بندي و غيره مورد بحث قرار خواهد گرفت.
-
نام دانشجو
نرگس سميرمي زاده
-
تاريخ ارائه
12/21/2022 12:00:00 AM
-
متن كامل
77282
-
پديد آورنده
نرگس سميرمي زاده
-
تاريخ ورود اطلاعات
1401/10/05
-
عنوان به انگليسي
Vision Transformer and Image Processing Applications
-
كليدواژه هاي فارسي
ترانسفورمر، توجه به خود، بينايي كامپيوتر، بينايي سطح بالا، بينايي سطح پايين.
-
كليدواژه هاي لاتين
Transformer, Self-attention, Computer Vision, High-level vision, Low-level vision
-
لينک به اين مدرک :