شماره ركورد
34750
پديد آورنده
صالح وطن خواه
عنوان
بررسي همگرايي با احتمال بالا روش گراديان تصادفي بريده شده با محرمانگي تفاضلي تحت نويزهاي دم سنگين
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق - گرايش مخابرات سيستم
سال تحصيل
1402
تاريخ دفاع
1404/11/29
استاد راهنما
دكتر شاهرخ فرهمند
استاد مشاور
-
دانشكده
مهندسي برق
چكيده
برش گراديان يك ابزار بنيادي در يادگيري عميق است كه همگرايي با احتمال بالا را براي روشهاي تصادفي مرتبه اول مانند SGD، AdaGrad و Adam در شرايط نويز دمسنگين كه در آموزش مدلهاي زباني بزرگ معمول است، بهبود ميبخشد. اين روش همچنين جزئي كليدي در مكانيزمهاي محرمانگي تفاضلي (DP) محسوب ميشود. با اين حال، تحليلهاي همگرايي با احتمال بالا در كارهاي موجود معمولاً نياز دارند كه آستانه برش با تعداد گامهاي بهينهسازي افزايش يابد، كه اين امر با مكانيزمهاي استاندارد DP مانند مكانيزم گاوسي ناسازگار است. در اين كار، ما اين شكاف را با ارائه نخستين تحليل همگرايي با احتمال بالا براي DP-Clipped-SGD با سطح برش ثابت پر ميكنيم. هم براي بهينهسازي هموار محدب و هم غيرمحدب تحت نويز دمسنگين — با فرض گشتاور مركزي كراندار مرتبه α ،كه در آن α ∈ (1,2]، — كاربرد دارد. نتايج ما نشان ميدهد كه با يك سطح برش ثابت، اين روش به يك همسايگي از جواب بهينه با نرخي سريعتر از نتايج موجود همگرا ميشود. اين همسايگي را ميتوان در برابر نويز ناشي از DP متعادل كرد، كه موازنهاي دقيقتر بين سرعت همگرايي و تضمينهاي حريم خصوصي فراهم ميآورد.
تاريخ ورود اطلاعات
1405/02/13
عنوان به انگليسي
High Probability Analysis of Clipped-SGD with Differential Privacy under Heavy-tailed Noise
تاريخ بهره برداري
4/21/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
صالح وطن خواه
چكيده به لاتين
Gradient clipping is a fundamental tool in Deep Learning, improving the high-probability convergence of stochastic first-order methods like SGD, AdaGrad, and Adam under heavy-tailed noise, which is common in training large language models. It is also a crucial component of Differential Privacy (DP) mechanisms. However, existing high-probability convergence analyses typically require the clipping threshold to increase with the number of optimization steps, which is incompatible with standard DP mechanisms like the Gaussian mechanism. In this work, we close this gap by providing the first high-probability convergence analysis for DP-Clipped-SGD with a fixed clipping level, applicable to both convex and non-convex smooth optimization under heavy-tailed noise, characterized by a bounded central α-th moment assumption, α ∈ (1, 2]. Our results show that, with a fixed clipping level, the method converges to a neighborhood of the optimal solution with a faster rate than the existing ones. The neighborhood can be balanced against the noise introduced by DP, providing a refined trade-off between convergence speed and privacy guarantees.
كليدواژه هاي فارسي
محرمانگي تفاضلي , نويز دم سنگين , همگرايي با احتمال بالا , برش گراديان
كليدواژه هاي لاتين
Differential Privacy , Heavy-tailed noise , High Probability Convergence , Gradient Clipping
Author
Saleh Vatan Khah
SuperVisor
Shahrokh Farahmand