شماره ركورد
30055
پديد آورنده
زهرا رحيمي
عنوان
ارائه يك روش جديد مبتني بر سخت افزار براي پشتيباني فشرده سازي در مرحله آموزش شبكه هاي عصبي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر- معماري سيستمهاي كامپيوتري
سال تحصيل
1399
تاريخ دفاع
1402/07/12
استاد راهنما
دكتر حاكم بيت الهي
استاد مشاور
دكتر هاجر فلاحتي
دانشكده
مهندسي كامپيوتر
چكيده
در سالهاي اخير، شبكههاي عصبي ژرف براي گستره مختلفي از وظايف مانند طبقهبندي تصوير، تشخيص اشيا و تشخيص گفتار استفاده شدهاند. همان طور كه كاربردهاي شبكههاي عصبي ژرف در حال رشد است، ظرفيت و مقياس آن ها نيز در حال رشد است كه منابع پردازشي و حافظه بيشتري براي استنتاج و آموزش چنين شبكه هايي مورد نياز است. براي اين كه شبكههاي عصبي ژرف به درستي كار كنند، معمولاً بايد آن ها را با يك مجموعه داده بزرگ براي تطبيق شبكه ها با برنامه هاي خاص آموزش داد. چنين آموزشي معمولاً روزها، هفته ها يا حتي بيشتر طول مي كشد و مقدار قابل توجهي انرژي مصرف مي كند. بنابراين، تقاضاهاي زيادي براي تسريع فرآيند آموزش از طريق گسترش الگوريتمهاي جديد و يا معماريهاي شتابدهنده تخصصي وجود دارد. با اين حال، هنوز شتابدهندههاي زيادي براي آموزش شبكههاي عصبي ژرف وجود ندارد و بيشتر معماريهاي شتابدهنده موجود بر روي استنتاج تمركز دارند. فرآيند آموزش به طور كلي شامل عمليات انتشار به جلو، انتشار به عقب و به روز رساني وزن است كه پردازش تكراري اين عمليات كه عمدتاً از عمليات جمع و ضرب تشكيل شده است، مصرف حافظه و انرژي بالايي را شامل مي شود و چالشي را براي اجراي سخت افزار ايجاد مي كند. براي رسيدگي به چالش هاي بيان شده، اخيراً بيشتر تلاش ها براي كاهش بار كاري پردازشي و كاهش زمان آموزش شبكههاي عصبي بر رويكردهايي مانند آموزش توزيع شده، فشرده سازي داده ها و آموزش با دقت كم متمركز هستند.
در اين پژوهش ما يك رويكرد فشردهسازي آگاه از داده ي جديد به نام S2NNرا براي بهره برداري از پراكندگي و شباهت در بردارهاي ورودي، وزن و گراديان در مرحله آموزش براي شتاب دهنده هاي سخت افزاري مختلف شبكههاي عصبي ژرف پيشنهاد مي كنيم و يك معماري شتاب دهنده جديد جهت اجراي جريان داده براي كاهش بي نظمي هاي ايجاد شده پيشنهاد مي كنيم. براي بررسي عملكرد روش پيشنهادي، اين روش بر روي سه شبكه عصبي ژرف تست شد. نتايج ما نشان مي دهد كه روش پيشنهادي از نظر ميانگين عملكرد و مصرف انرژي به ترتيب ×27.1 و ×59.8 از شتاب دهنده Eyeriss برتري دارد. همچنين در مقايسه با شتاب دهنده آگاه از تكرار و پراكندگي و يك روش آگاه از شباهت داده ورودي از لحاظ كارايي به ترتيب ×4.7 و ×6.8 و از لحاظ كاهش انرژي مصرفي به ترتيب ×3.5 و ×7.2 بهبود داريم.
تاريخ ورود اطلاعات
1402/08/22
عنوان به انگليسي
Propose a new hardware-based approach to support compression in the neural networks training phase
تاريخ بهره برداري
10/3/2024 12:00:00 AM
دانشجوي وارد كننده اطلاعات
زهرا رحيمي
چكيده به لاتين
In recent years, deep neural networks have been used for a wide range of tasks such as image classification, object detection and speech recognition. As the applications of deep neural networks are growing, their capacity and scale are also growing, which requires more processing and memory resources for inference and training such networks. For deep neural networks to work properly, they usually have to be trained with a large data set to adapt the networks to specific applications. Such training usually takes days, weeks or even longer and consumes a significant amount of energy. Therefore, there are high demands for accelerating the training process through developing new algorithms or specialized accelerator architectures. However, there are still not many accelerators for training deep neural networks and most of the existing accelerator architectures focus on inference. The training process generally involves forward propagation, back propagation and weight update operations, which involve repetitive processing of these operations, which are mainly composed of addition and multiplication operations, which consume high memory and energy and create a challenge for hardware implementation. To address the challenges mentioned, recently, most of the efforts to reduce the processing workload and reduce the training time of neural networks are focused on approaches such as distributed training, data compression, and low-precision training.
In this research, we propose a new data-aware compression approach called S2NN to exploit sparsity and similarity in input vectors, weights and gradients in the training phase for different hardware accelerators of deep neural networks and propose a new accelerator architecture to implement data flow to reduce the irregularities created. To evaluate the performance of the proposed method, this method was tested on three deep neural networks. Our results show that the proposed method is 27.1× and 59.8× superior to the Eyeriss accelerator in terms of average performance and energy consumption, respectively. Also, it is 4.7×, 6.8×, 3.9× and 2.6× faster compared to accelerators that are aware of sparsity and similarity. It reduces the average energy consumption compared to them by 3.5×, 7.2×, 3.6× and 2.5×.
كليدواژه هاي فارسي
شبكه هاي عصبي ژرف , شتاب دهنده سخت افزاري , آموزش , فشردهسازي , پراكندگي
كليدواژه هاي لاتين
Deep neural networks , hardware accelerator , training , compression , sparsity
Author
Zahra Rahimi
SuperVisor
Dr.Hakem Beitollahi