حسين رضائي

عنوان

كمي‌سازي بيش‌برازش در مدل‌هاي شبكه‌هاي عصبي از طريق تحليل بردار بازنمايي: تضمين حريم خصوصي و تعميم پذيري

مقطع تحصيلي

ارشد

رشته تحصيلي

مهندسي كامپيوتر - هوش مصنوعي و رباتيكز

سال تحصيل

1400

تاريخ دفاع

1403/06/27

استاد راهنما

دكتر آرش عبدي هجراندوست - دكتر محمد سبك‌رو

استاد مشاور

-‎--‎--

دانشكده

مهندسي كامپيوتر

چكيده

مدل‌‌هاي يادگيري عميق كه بيش از حد آموزش ديده‌‌اند يا دچار بيش برازش شده‌اند، در برابر نشت دانش آسيب ‌پذيرتر هستند. اين موضوع حريم خصوصي را به خطر مي‌اندازد. سناريو‌ايي را در نظر بگيريد كه يك مدل را بدون اطلاع از دقت آموزشي آن از يك همكار دريافت كرده‌ايم. در اين حالت نمي ‌توانيم تشخيص دهيم كه اين مدل روي داده‌هاي آموزشي خود دچار بيش برازش شده يا بيش از حد آموزش ديده است. اين امكان وجود دارد كه اين مدل عمداً بيش از حد آموزش ديده باشد تا در طول آزمون آسيب ‌پذير شود. از طرف ديگر با در نظر گرفتن يك مدل داراي بيش برازش يا بيش از حد آموزش ديده كه ممكن است در زمان آزمون و حتي برخي از تست‌هاي تعميم عملكرد خوبي داشته باشد، نمي توان مطمئن بود كه آن مدل دچار بيش برازش نشده است. انجام آزمون تعميم جامع و حملات حريم خصوصي نيز هزينه‌بر است. هدف ما در اين پايان نامه اين است كه به اين مسائل مهم بپردازيم و حريم خصوصي و تعميم را تنها با استفاده از داده‌هاي آزمون تضمين كنيم. براي دستيابي به اين هدف، ما زواياي بين بردار بازنمايي و وزن‌هاي آخرين لايه شبكه‌هاي عصبي را تجزيه و تحليل خواهيم كرد. اين كار ما را قادر مي‌ سازد بدون دسترسي به داده‌‌هاي آموزشي يا آگاهي از دقت آن داده‌‌ها، بيش ‌برازش را كمي كنيم. ما در اين پايان نامه رويكرد خود را در مورد معماري‌ها و مجموعه‌هاي داده مختلف ارزيابي خواهيم كرد.

تاريخ ورود اطلاعات

1404/05/28

عنوان به انگليسي

Quantifying Overfitting in Neural Networks Models Through Representation Vector Analysis: Ensuring Privacy an‎d Generalizability

تاريخ بهره برداري

1/1/1900 12:00:00 AM

دانشجوي وارد كننده اطلاعات

حسين رضائي

Name: حسين رضائي
Author: حسين رضائي

چكيده به لاتين

Deep learning models that are overfitted/overtrained are mo‎re vulnerable to knowledge leakage, which poses a risk to privacy. Consider a scenario where we have received a model from a third-party collabo‎rato‎r without knowing its training accuracy. In this case, we cannot determine that this model is over-fitted o‎r over-trained on its training data. It is possible that the model was intentionally over-trained to become vulnerable during testing. On the other han‎d, considering an over-fitted o‎r over-trained model that may perfo‎rm well during testing an‎d even some generalization tests, one cannot be sure that it is not over-fitted. Comprehensive generalization tests an‎d privacy attacks are also costly. Our goal in this thesis is to address these impo‎rtant issues an‎d ensure privacy an‎d generalizability using only test data. To achieve this goal, we analyze the angles between the representation vecto‎r an‎d the weights of the last layer of neural netwo‎rks. This enables us to quantify overfitting without having access to the training data o‎r knowing the accuracy of that data. In this thesis, we will eva‎luate our approach on different architectures an‎d datasets.

كليدواژه هاي فارسي

بيش‌برازش , نشت دانش , حفظ حريم خصوصي , تعميم

كليدواژه هاي لاتين

Overfitting , Knowledge Leakage , Privacy Preserving , Generalization

Author

Hossein Rezaei

SuperVisor

Arash Abdi Hejrandoost - Mohammad Sabokrou

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=33575&Field=0&DTC=6