شماره ركورد
28906
پديد آورنده
نيما اميرافشار
عنوان
طراحي واحد ضربكنندهي تقريبي ماتريسها مبتنيبر معماري ضرباني با قابليت تنظيم پوياي ميزان دقت
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق
سال تحصيل
1399
تاريخ دفاع
1402/06/29
استاد راهنما
جناب آقاي دكتر هادي شهريار شاهحسيني
دانشكده
برق
چكيده
امروزه عمل ضرب ماتريسها از جمله عمليات محاسباتي است كه در بسياري از كاربردهاي متنوع به تعداد زيادي مورد استفاده قرار ميگيرد. اجراي ضرب ماتريسها در سيستمهاي پردازشي عمومي، غير بهينه و ناكارامد است كه اين امر بهواسطهي جابهجايي بسيار زياد دادهها ميان منابع حافظه و محاسباتي و به دليل تعداد قابلتوجه عمليات ضرب و جمع بر روي درايههاي ماتريسها اتفاق ميافتد. بكارگيري معماري ضرباني در طراحي واحد ضربكنندهي ماتريسها ميتواند بسياري از چالشهاي مرتبط با جابهجايي دادهها را برطرف سازد؛ به عبارت ديگر، در معماري ضرباني تعداد مشخصي از عنصرهاي پردازشي در كنار يكديگر قرار ميگيرند كه دادهها در هر سيكل در ميان آنها بهصورت ضرباني جريان مييابند. از سوي ديگر، بسياري از كاربردهاي متنوع در مقابل مقدار مشخصي از خطا تحملپذير هستند، از اينرو با بكارگيري محاسبات تقريبي و با به خطر انداختن دقت محاسبات، ميتوان بهبود قابلتوجهي در كارايي سختافزار ايجاد كرد.
هدف اصلي در اين پژوهش طراحي واحدهاي ضربكنندهي تقريبي ماتريسها مبتنيبر معماري ضرباني است. در واحدهاي تقريبي پيشنهادي، ضربكنندههاي دقيق موجود در عنصرهاي پردازشي با ضربكنندههاي تقريبي جايگزين ميشوند. بر اين اساس، در قدم اول تعداد زيادي ضربكنندهي تقريبي كه مبتنيبر ناديده گرفتن رقمنقلي هستند، جهت قرار گيري در عنصرهاي پردازشي طراحي شدند. ضربكنندههاي تقريبي بدونعلامت پيشنهادي (CDM8) در مقايسه با ضربكنندهي دقيق معيارهاي تأخير مسير بحراني، توان مصرفي و مساحت را بهطور متوسط 29%، 29% و 30% بهبود دادهاند. همچنين 35 عدد ضربكنندهي تقريبي علامتدار (SCDM8) طراحي شد كه در مقايسه با ضربكنندهي علامتدار دقيق معيارهاي يادشده را بهترتيب 26/6%، 27/7% و 21% بهبود دادند. با بكارگيري ضربكنندههاي تقريبي SCDM8 در عنصرهاي پردازشي، 35 عدد واحد ضربكنندهي تقريبي ماتريسها مبتنيبر معماري ضرباني ارائه شد كه در مقايسه با واحد ضربكنندهي دقيق تأخير مسير بحراني، توان مصرفي و مساحت را بهطور متوسط 29/9%، 14/6% و 10/1% بهبود دادند؛ همچنين، واحدهاي پيشنهادي توانستند در مقايسه با واحدهاي ضربكنندهي تقريبي ضرباني موجود كه در سالهاي اخير ارائه شدند، معيارهاي تأخير مسير بحراني، توانمصرفي و MRED را بهترتيب 25/4%، 7/3% و 54% بهبود دهند، اما از نظر مساحت تقريباً مشابه يكديگر بودند. بنابراين واحدهاي پيشنهادي تعادل بهتري ميان معيارهاي دقت و سختافزار ايجاد كردند.
تاريخ ورود اطلاعات
1402/07/29
عنوان به انگليسي
Design of Systolic-Based Approximate Matrix Multiplier Units with Adjustable Accuracy
تاريخ بهره برداري
9/19/2024 12:00:00 AM
دانشجوي وارد كننده اطلاعات
نيما اميرافشار
چكيده به لاتين
Nowadays, matrix multiplication is one of the computational operations that are used in many diverse applications. The implementation of matrix multiplication in general processing systems is non-optimal and inefficient, which happens due to the large amount of data transfer between memory and computing resources, and also the significant number of multiplication and addition operations. Utilizing systolic architecture in the design of the matrix multiplier unit can solve many challenges related to data transfer. In other words, in the systolic architecture, a certain number of processing elements are placed next to each other, and the data flows between them in a systolic manner in each cycle. On the other hand, many diverse applications are tolerant to a certain amount of error, so by using approximate computing and compromising the accuracy of calculations, a significant improvement in hardware performance can be made. The main goal of this research is to design the approximate matrix multiplier units based on systolic architecture. In the proposed approximate units, the exact multipliers in the processing elements are replaced with approximate multipliers. Based on this, in the first step, a large number of approximate multipliers based on disregarding carry were designed to be placed in the processing elements. The proposed unsigned approximate multipliers (CDM8) have improved critical path delay, power consumption and area by 29%, 29% and 30% on average compared to the exact multiplier. Furthermore, 35 approximate signed multipliers (SCDM8) were designed, which improved the mentioned criteria by 26.6%, 27.7% and 21%, respectively, compared to the exact signed multiplier. By using SCDM8s in processing elements, 35 units of approximate matrix multipliers based on systolic architecture were designed, which compared to the exact multiplier unit, have improved critical path delay, power consumption and area 29.9%, 14.6%, and 10.1% on average. Moreover, the proposed units were able to improve the criteria of critical path delay, power consumption and MRED by 25.4%, 7.3% and 54%, respectively, compared to the existing approximate systolic multiplier units that were presented in recent years. But as for area, they were almost similar to each other. Thus, the proposed units struck a better balance between accuracy and hardware criteria.
كليدواژه هاي فارسي
واحد ضربكنندهي ماتريسها , معماري ضرباني , محاسبات تقريبي , ضربكنندههاي عددي تقريبي , مصرف بهينه و سرعت بالا
كليدواژه هاي لاتين
Matrix multiplier unit , systolic architecture , approximate computing , approximate multipliers , efficient and high performance
Author
Nima Amirafshar
SuperVisor
Hadi Shahriar Shahhoseini