صالح وطن خواه

عنوان

بررسي همگرايي با احتمال بالا روش گراديان تصادفي بريده شده با محرمانگي تفاضلي تحت نويزهاي دم سنگين

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي برق - گرايش مخابرات سيستم

سال تحصيل

1402

تاريخ دفاع

1404/11/29

استاد راهنما

دكتر شاهرخ فرهمند

استاد مشاور

دانشكده

مهندسي برق

چكيده

برش گراديان يك ابزار بنيادي در يادگيري عميق است كه همگرايي با احتمال بالا را براي روش‌هاي تصادفي مرتبه اول مانند SGD، AdaGrad و Adam در شرايط نويز دم‌سنگين كه در آموزش مدل‌هاي زباني بزرگ معمول است، بهبود مي‌بخشد. اين روش همچنين جزئي كليدي در مكانيزم‌هاي محرمانگي تفاضلي (DP) محسوب مي‌شود. با اين حال، تحليل‌هاي همگرايي با احتمال بالا در كارهاي موجود معمولاً نياز دارند كه آستانه برش با تعداد گام‌هاي بهينه‌سازي افزايش يابد، كه اين امر با مكانيزم‌هاي استاندارد DP مانند مكانيزم گاوسي ناسازگار است. در اين كار، ما اين شكاف را با ارائه نخستين تحليل همگرايي با احتمال بالا براي DP-Clipped-SGD با سطح برش ثابت پر مي‌كنيم. هم براي بهينه‌سازي هموار محدب و هم غيرمحدب تحت نويز دم‌سنگين — با فرض گشتاور مركزي كران‌دار مرتبه α ،كه در آن α ∈ (1,2]، — كاربرد دارد. نتايج ما نشان مي‌دهد كه با يك سطح برش ثابت، اين روش به يك همسايگي از جواب بهينه با نرخي سريع‌تر از نتايج موجود همگرا مي‌شود. اين همسايگي را مي‌توان در برابر نويز ناشي از DP متعادل كرد، كه موازنه‌اي دقيق‌تر بين سرعت همگرايي و تضمين‌هاي حريم خصوصي فراهم مي‌آورد.

تاريخ ورود اطلاعات

1405/02/13

عنوان به انگليسي

High Probability Analysis of Clipped-SGD with Differential Privacy under Heavy-tailed Noise

تاريخ بهره برداري

4/21/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

صالح وطن خواه

Name: صالح وطن خواه
Author: صالح وطن خواه

چكيده به لاتين

Gradient clipping is a fundamental tool in Deep Learning, improving the high-probability convergence of stochastic first-order methods like SGD, AdaGrad, an‎d Adam under heavy-tailed noise, which is common in training large language models. It is also a crucial component of Differential Privacy (DP) mechanisms. However, existing high-probability convergence analyses typically require the clipping threshold to increase with the number of optimization steps, which is incompatible with stan‎dard DP mechanisms like the Gaussian mechanism. In this work, we close this gap by providing the first high-probability convergence analysis for DP-Clipped-SGD with a fixed clipping level, applicable to both convex an‎d non-convex smooth optimization under heavy-tailed noise, characterized by a bounded central α-th moment assumption, α ∈ (1, 2]. Our results show that, with a fixed clipping level, the method converges to a neighborhood of the optimal solution with a faster rate than the existing ones. The neighborhood can be balanced against the noise introduced by DP, providing a refined trade-off between convergence speed an‎d privacy guarantees.

كليدواژه هاي فارسي

محرمانگي تفاضلي , نويز دم سنگين , همگرايي با احتمال بالا , برش گراديان

كليدواژه هاي لاتين

Differential Privacy , Heavy-tailed noise , High Probability Convergence , Gradient Clipping

Author

Saleh Vatan Khah

SuperVisor

Shahrokh Farahmand

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34750&Field=0&DTC=6