• شماره ركورد
    28906
  • پديد آورنده

    نيما اميرافشار

  • عنوان
    طراحي واحد ضرب‌كننده‌ي تقريبي ماتريس‌ها مبتني‌بر معماري ضرباني با قابليت تنظيم پوياي ميزان دقت
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق
  • سال تحصيل
    1399
  • تاريخ دفاع
    1402/06/29
  • استاد راهنما
    جناب آقاي دكتر هادي شهريار شاه‌حسيني
  • دانشكده
    برق
  • چكيده
    امروزه عمل ضرب ماتريس‌ها از جمله عمليات محاسباتي است كه در بسياري از كاربرد‌هاي متنوع به تعداد زيادي مورد استفاده قرار مي‌گيرد. اجراي ضرب ماتريس‌ها در سيستم‌هاي پردازشي عمومي، غير بهينه و ناكارامد است كه اين امر به‌واسطه‌ي جابه‌جايي بسيار زياد داده‌ها ميان منابع حافظه و محاسباتي و به دليل تعداد قابل‌توجه عمليات ضرب و جمع بر روي درايه‌هاي ماتريس‌ها اتفاق مي‌افتد. بكارگيري معماري ضرباني در طراحي واحد ضرب‌كننده‌ي ماتريس‌ها مي‌تواند بسياري از چالش‌هاي مرتبط با جابه‌جايي داده‌ها را برطرف سازد؛ به عبارت ديگر، در معماري ضرباني تعداد مشخصي از عنصر‌هاي پردازشي در كنار يكديگر قرار مي‌گيرند كه داده‌ها در هر سيكل در ميان آن‌ها به‌صورت ضرباني جريان مي‌يابند. از سوي ديگر، بسياري از كاربرد‌هاي متنوع در مقابل مقدار مشخصي از خطا تحمل‌پذير هستند، از اين‌رو با بكارگيري محاسبات تقريبي و با به خطر انداختن دقت محاسبات، مي‌توان بهبود قابل‌توجهي در كارايي سخت‌افزار ايجاد كرد. هدف اصلي در اين پژوهش طراحي واحد‌هاي ضرب‌كننده‌ي تقريبي ماتريس‌ها مبتني‌بر معماري ضرباني است. در واحدهاي تقريبي پيشنهادي، ضرب‌كننده‌هاي دقيق موجود در عنصر‌هاي پردازشي با ضرب‌كننده‌هاي تقريبي جايگزين مي‌شوند. بر اين اساس، در قدم اول تعداد زيادي ضرب‌كننده‌ي تقريبي كه مبتني‌بر ناديده گرفتن رقم‌نقلي هستند، جهت قرار گيري در عنصر‌هاي پردازشي طراحي شدند. ضرب‌كننده‌هاي تقريبي بدون‌علامت پيشنهادي (CDM8) در مقايسه با ضرب‌كننده‌ي دقيق معيار‌هاي تأخير مسير بحراني، توان مصرفي و مساحت را به‌طور متوسط 29%، 29% و 30% بهبود داده‌اند. همچنين 35 عدد ضرب‌كننده‌ي تقريبي علامت‌دار (SCDM8) طراحي شد كه در مقايسه با ضرب‌كننده‌ي علامت‌دار دقيق معيارهاي يادشده را به‌ترتيب 26/6%، 27/7% و 21% بهبود دادند. با بكارگيري ضرب‌كننده‌هاي تقريبي SCDM8 در عنصر‌هاي پردازشي، 35 عدد واحد ضرب‌كننده‌ي تقريبي ماتريس‌ها مبتني‌بر معماري ضرباني ارائه شد كه در مقايسه با واحد ضرب‌كننده‌ي دقيق تأخير مسير بحراني، توان مصرفي و مساحت را به‌طور متوسط 29/9%، 14/6% و 10/1% بهبود دادند؛ همچنين، واحد‌هاي پيشنهادي توانستند در مقايسه با واحد‌هاي ضرب‌كننده‌ي تقريبي ضرباني موجود كه در سال‌هاي اخير ارائه شدند، معيار‌هاي تأخير مسير بحراني، توان‌مصرفي و MRED را به‌ترتيب 25/4%، 7/3% و 54% بهبود دهند، اما از نظر مساحت تقريباً مشابه يكديگر بودند. بنابراين واحدهاي پيشنهادي تعادل بهتري ميان معيارهاي دقت و سخت‌افزار ايجاد كردند.
  • تاريخ ورود اطلاعات
    1402/07/29
  • عنوان به انگليسي
    Design of Systolic-Based Approximate Matrix Multiplier Units with Adjustable Accuracy
  • تاريخ بهره برداري
    9/19/2024 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    نيما اميرافشار

  • چكيده به لاتين
    Nowadays, matrix multiplication is one of the computational operations that are used in many diverse applications. The implementation of matrix multiplication in general processing systems is non-optimal and inefficient, which happens due to the large amount of data transfer between memory and computing resources, and also the significant number of multiplication and addition operations. Utilizing systolic architecture in the design of the matrix multiplier unit can solve many challenges related to data transfer. In other words, in the systolic architecture, a certain number of processing elements are placed next to each other, and the data flows between them in a systolic manner in each cycle. On the other hand, many diverse applications are tolerant to a certain amount of error, so by using approximate computing and compromising the accuracy of calculations, a significant improvement in hardware performance can be made. The main goal of this research is to design the approximate matrix multiplier units based on systolic architecture. In the proposed approximate units, the exact multipliers in the processing elements are replaced with approximate multipliers. Based on this, in the first step, a large number of approximate multipliers based on disregarding carry were designed to be placed in the processing elements. The proposed unsigned approximate multipliers (CDM8) have improved critical path delay, power consumption and area by 29%, 29% and 30% on average compared to the exact multiplier. Furthermore, 35 approximate signed multipliers (SCDM8) were designed, which improved the mentioned criteria by 26.6%, 27.7% and 21%, respectively, compared to the exact signed multiplier. By using SCDM8s in processing elements, 35 units of approximate matrix multipliers based on systolic architecture were designed, which compared to the exact multiplier unit, have improved critical path delay, power consumption and area 29.9%, 14.6%, and 10.1% on average. Moreover, the proposed units were able to improve the criteria of critical path delay, power consumption and MRED by 25.4%, 7.3% and 54%, respectively, compared to the existing approximate systolic multiplier units that were presented in recent years. But as for area, they were almost similar to each other. Thus, the proposed units struck a better balance between accuracy and hardware criteria.
  • كليدواژه هاي فارسي
    واحد ضرب‌كننده‌ي ماتريس‌ها , معماري ضرباني , محاسبات تقريبي , ضرب‌كننده‌هاي عددي تقريبي , مصرف بهينه و سرعت بالا
  • كليدواژه هاي لاتين
    Matrix multiplier unit , systolic architecture , approximate computing , approximate multipliers , efficient and high performance
  • Author
    Nima Amirafshar
  • SuperVisor
    Hadi Shahriar Shahhoseini