انوش مه جبين

عنوان

ارائه يك روش دقت تركيبي عدد صحيح مؤثر براي افزايش عملكرد در شبكه هاي يادگيري عميق

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي كامپيوتر

سال تحصيل

1401

تاريخ دفاع

1404/07/16

استاد راهنما

دكتر حاكم بيت الهي

استاد مشاور

دكتر عبدالله اميرخاني شهركي

دانشكده

مهندسي كامپيوتر

چكيده

شبكه‌هاي عصبي عميق DNNs در حوزه ي بينايي كامپيوتري و سامانه هاي خودران به موفقيت هاي چشمگيري دست يافته اند، اما افزايش مقياس آن ها منجر به هزينه هاي محاسباتي و مصرف انرژي قابل توجهي مي شود، به ويژه در هنگام آموزش. چندي سازي راهكاري اميدواركننده براي بهبود اين مشكلات است، اما روش هاي آموزش زير 8 بيت موجود اغلب با ناپايداري و كاهش چشمگير دقت مواجه مي شوند كه كاربرد عملي آنها را محدود مي سازد. در ا ين پژوهش، ما روش آموزش ايستا با اعداد صحيح تركيبي SMIT را معرفي مي كنيم. چارچوبي ساده اما كارآمد براي آموزش سرتاسري شبكه هاي عصبي با پهناي بيت ثابت و ناهمگن براي وزن ها، فعالسازي ها و گراديان ها. با انجام يك بررسي حساسيت گسترده، پيكربندي بهينه ي 8E6/A4/W( وزن ها با دقت 4 بيت، فعال سازيها با دقت 6 بيت، و گراديان ها با دقت 8 بيت( شناسايي شد كه تعادلي ميان بهره وري محاسباتي و پايداري آموزش برقرار مي سازد. برخالف روش هاي پويا يا وابسته به معماري، SMIT بر تخصيص ايستا تكيه دارد و نيازي به تنظيم لايه به لايه يا تغييرات معماري ندارد. آزمايش ها در وظايف مختلفي از جمله طبقه بندي، تشخيص، و بخشبندي معنايي، اثربخشي SMIT را تأييد مي كنند . براي نمونه، در مدل -18ResNet با مجموعه داده -10CIFAR، SMIT با دستيابي به دقت ٪ 94.24 عملكردي تقريباً برابر با حالت 32FP( ٪ 95.34 )ارائه مي دهد ، اين تفاوت تنها حدود ٪ 1.1 افت دقت را نشان مي دهد . براي وظايف پيچيده تري همچون تشخيص اشياء و بخشبندي معنايي نيز SMIT تنها 1.5٪ پايين تر از عملكرد 32FP باقي مي ماند . در تضاد با روش هاي زير 8 بيت پيشين كه معموالً در دقت 5 بيت با افت شديد مواجه شده و در دقت 4 بيت كامالً واگرا مي شوند . SMIT با طراحي ايستا و سختافزارپسند، دقتي نزديك به حالت تمام دقت ارائه مي دهد

تاريخ ورود اطلاعات

1404/10/15

عنوان به انگليسي

A Static Mixed-Integer Approach for Enhancing Performance in Deep Neural Networks

تاريخ بهره برداري

10/8/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

انوش مه جبين

Name: انوش مه جبين
Author: انوش مه جبين

چكيده به لاتين

Deep neural netwo‎rks (DNNs) have achieved remarkable success in computer vision an‎d autonomous systems, yet their growing scale leads to substantial computational an‎d energy costs, especially during training. Quantization provides a promising path to efficiency, but existing sub-8-bit training methods often suffer from instability an‎d significant accuracy loss, limiting their practicality. In this wo‎rk, we present Static Mixed-Integer Training (SMIT), a simple yet effective framewo‎rk fo‎r end-to-end DNN training with fixed heterogeneous bit-widths fo‎r weights, activations, an‎d gradients. Through extensive sensitivity analysis, we identify an optimal configuration, W4/A6/E8 (4-bit weights, 6-bit activations, 8-bit gradients), that achieves a balance between computational efficiency an‎d training stability. Unlike dynamic o‎r architecture-dependent schemes, SMIT relies on a static allocation that requires no per-layer adjustments o‎r architectural modifications. Experiments across classification, detection, an‎d segmentation tasks confirm the effectiveness of SMIT. On ResNet-18 with CIFAR-10, SMIT achieves 94.24% accuracy compared to 95.34% in FP32, a dro‎p of only ~1.1%. Fo‎r mo‎re complex tasks such as object detection an‎d semantic segmentation, SMIT remains within 1.5% of FP32 perfo‎rmance. In contrast to prio‎r sub-8-bit methods which typically degrade severely at 5-bit precision an‎d diverge entirely at 4-bit SMIT delivers near full-precision accuracy with a static, hardware-friendly design.

كليدواژه هاي فارسي

دقت تركيبي , شبكه عصبي عميق , چندي سازي , دقت بيتي ثابت

كليدواژه هاي لاتين

Mixed Precision , Deep Neural Network , Quantization , Static Mixed Precision

Author

Anoosh Mahjabin

SuperVisor

Hakem beitollahi - pejman lotfi kamran

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34471&Field=0&DTC=6