• شماره ركورد
    12707
  • عنوان
    بررسي روش هاي بهينه سازي شتاب دهنده هاي ترنسفورمر
  • سال تحصيل
    1401
  • استاد راهنما
    حاكم بيت الهي
  • چکيده
    تازه‌ترين پيشرفت‌ها در طراحي معماري‌هاي شبكه عصبي به سمت مدل‌هاي ترانسفورمر پيش رفته‌اند. اين مدل‌ها دقت بسيار بالاتري را در طيف گسترده‌اي از كاربردها در حوزه بينايي ماشين، پردازش زبان طبيعي و شناسايي گفتار به دست مي‌آورند. اين روند در چند سال اخير از زمان معرفي اوليه مدل‌هاي ترانسفورمر پايدار بوده است. با اين حال، مقدار محاسبات و پهناي باند مورد نياز براي انجام استنتاج مدل‌هاي ترانسفورمر اخير به نرخ قابل توجهي افزايش يافته است و اين امر باعث مشكل در استفاده از آن‌ها در برنامه‌هاي حساس به تاخير شده است. به همين دليل، تمركز بيشتري بر بهينه‌سازي مدل‌هاي ترانسفورمر وجود دارد، با روش‌هايي كه از تغيير طراحي معماري تا توسعه شتاب‌دهنده‌هاي خاص ترانسفورمر مي‌تواند متغير باشد. در اين پژوهش ما به بررسي روش‌هاي مختلف براي استنتاج بهينه ترانسفورمر مي‌پردازيم، از جمله: (1) تجزيه و تحليل نقاط ضعف در معماري‌هاي ترانسفورمر موجود و تشابه‌ها و تفاوت‌هاي آن‌ها با مدل‌هاي پيشين كانولوشني؛ (2) تاثير معماري ترانسفورمر بر سخت‌افزار، شامل تاثير عمليات غيرخطي مانند نرمال‌سازي لايه، Softmax و GELU و همچنين عمليات خطي روي طراحي سخت‌افزار؛ (3) روش‌هاي بهينه‌سازي يك معماري ترانسفورمر ثابت.
  • نام دانشجو

    ابوالفضل بيات

  • تاريخ ارائه
    11/18/2023 12:00:00 AM
  • متن كامل
    80966
  • پديد آورنده

    ابوالفضل بيات

  • تاريخ ورود اطلاعات
    1402/09/03
  • عنوان به انگليسي
    Investigating optimization methods of transformer accelerators
  • كليدواژه هاي فارسي
    مدل‌هاي ترانسفورمر , مكانيزم توجه , شتاب‌دهنده‌هاي شبكه‌هاي عصبي عميق , استنتاج كارآمد ترانسفورمر , كوانتيزه‌سازي , تنگناها در معماري ترانسفورمر
  • كليدواژه هاي لاتين
    Transformer models , attention mechanism , deep neural network accelerators , efficient transformer inference , quantization , bottlenecks in transformer architecture