شماره ركورد
33575
پديد آورنده
حسين رضائي
عنوان
كميسازي بيشبرازش در مدلهاي شبكههاي عصبي از طريق تحليل بردار بازنمايي: تضمين حريم خصوصي و تعميم پذيري
مقطع تحصيلي
ارشد
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
سال تحصيل
1400
تاريخ دفاع
1403/06/27
استاد راهنما
دكتر آرش عبدي هجراندوست - دكتر محمد سبكرو
استاد مشاور
-----
دانشكده
مهندسي كامپيوتر
چكيده
مدلهاي يادگيري عميق كه بيش از حد آموزش ديدهاند يا دچار بيش برازش شدهاند، در برابر نشت دانش آسيب پذيرتر هستند. اين موضوع حريم خصوصي را به خطر مياندازد. سناريوايي را در نظر بگيريد كه يك مدل را بدون اطلاع از دقت آموزشي آن از يك همكار دريافت كردهايم. در اين حالت نمي توانيم تشخيص دهيم كه اين مدل روي دادههاي آموزشي خود دچار بيش برازش شده يا بيش از حد آموزش ديده است. اين امكان وجود دارد كه اين مدل عمداً بيش از حد آموزش ديده باشد تا در طول آزمون آسيب پذير شود. از طرف ديگر با در نظر گرفتن يك مدل داراي بيش برازش يا بيش از حد آموزش ديده كه ممكن است در زمان آزمون و حتي برخي از تستهاي تعميم عملكرد خوبي داشته باشد، نمي توان مطمئن بود كه آن مدل دچار بيش برازش نشده است. انجام آزمون تعميم جامع و حملات حريم خصوصي نيز هزينهبر است. هدف ما در اين پايان نامه اين است كه به اين مسائل مهم بپردازيم و حريم خصوصي و تعميم را تنها با استفاده از دادههاي آزمون تضمين كنيم. براي دستيابي به اين هدف، ما زواياي بين بردار بازنمايي و وزنهاي آخرين لايه شبكههاي عصبي را تجزيه و تحليل خواهيم كرد. اين كار ما را قادر مي سازد بدون دسترسي به دادههاي آموزشي يا آگاهي از دقت آن دادهها، بيش برازش را كمي كنيم. ما در اين پايان نامه رويكرد خود را در مورد معماريها و مجموعههاي داده مختلف ارزيابي خواهيم كرد.
تاريخ ورود اطلاعات
1404/05/28
عنوان به انگليسي
Quantifying Overfitting in Neural Networks Models Through Representation Vector Analysis: Ensuring Privacy and Generalizability
تاريخ بهره برداري
1/1/1900 12:00:00 AM
دانشجوي وارد كننده اطلاعات
حسين رضائي
چكيده به لاتين
Deep learning models that are overfitted/overtrained are more vulnerable to knowledge leakage, which poses a risk to privacy. Consider a scenario where we have received a model from a third-party collaborator without knowing its training accuracy. In this case, we cannot determine that this model is over-fitted or over-trained on its training data. It is possible that the model was intentionally over-trained to become vulnerable during testing. On the other hand, considering an over-fitted or over-trained model that may perform well during testing and even some generalization tests, one cannot be sure that it is not over-fitted. Comprehensive generalization tests and privacy attacks are also costly. Our goal in this thesis is to address these important issues and ensure privacy and generalizability using only test data. To achieve this goal, we analyze the angles between the representation vector and the weights of the last layer of neural networks. This enables us to quantify overfitting without having access to the training data or knowing the accuracy of that data. In this thesis, we will evaluate our approach on different architectures and datasets.
كليدواژه هاي فارسي
بيشبرازش , نشت دانش , حفظ حريم خصوصي , تعميم
كليدواژه هاي لاتين
Overfitting , Knowledge Leakage , Privacy Preserving , Generalization
Author
Hossein Rezaei
SuperVisor
Arash Abdi Hejrandoost - Mohammad Sabokrou