-
شماره ركورد
12786
-
عنوان
بررسي رويكردهاي توزيعشده در آموزش شبكههاي عصبي عميق
-
سال تحصيل
1400
-
استاد راهنما
دكتر مهرداد آشتياني
-
چکيده
امروزه با توجه به اهميت مدلهاي پيشآموزش ديده مثل Bert و GPT3 و استفاده از ترانسفورمرها در هوش مصنوعي كه مدلهاي بزرگي محسوب ميشوند، اين نياز احساس ميشود كه به دنبال روشي بود تا سرعت آموزش اين مدلها را افزايش داد. براي رسيدن به اين هدف، موضوع آموزش مدلها به صورت توزيعشده مهمتر از گذشته شدهاست. همانطور كه از اسم آن مشخص است با استفاده از اين روش، ميتوان آموزش مدلها را روي چندين پردازندهي گرافيكي انجام داد. اين روش براي تمام مدلها ميتواند استفاده شود اما وجود آن براي مدلهايي كه آموزش آنها به زمان و داده بيشتري نياز دارد، بيشتر احساس ميشود. يكي از مزاياي آموزش مدلها با اين روش، حفظ حريم خصوصي افراد است. با توجه به كارهاي انجام شده در آموزش مدلها از تمام ظرفيت پردازندههاي گرافيكي به صورت بهينه استفاده نميشود و با توجه به اينكه اين منابع براي ما از اهميت بالايي برخوردارند، يكي از اهداف اين است كه بتوان به صورت بهينه از اين منابع استفاده كرد. از اين نظر كه ما براي آموزش اين مدلها به مقدار زيادي داده نياز داريم و به طور مثال اگر اين دادهها مربوط به بيماران باشد با اين روش ديگر نيازي نيست دادهها به يك سرويسدهنده واحد منتقل شود و تنها وزنها و مؤلفههاي مدلي كه با آن دادهها آموزش داده شده است، منتقل ميشود. از طرفي روزبهروز حجم دادههايي كه توليد ميشوند در حال افزايش هستند و براي مدلهاي پيشآموزش ديده، هر چه مقدار دادهي بيشتري را ديده باشند، يك مزيت به شمار ميرود. به همين دليل اين موضوع ميتواند در جهت سرعت بخشيدن به آموزش مدلهاي بزرگ، نقش چشمگيري ايفا كند. در كارهاي انجامشده نكتهاي كه كمتر در نظر گرفتهشده، ناهمسان بودن گرهها است و در اكثر كارها فرض بر اين گذاشتهشده كه گرهها همسان هستند كه اين فرض ميتواند اندكي با واقعيت متفاوت باشد.
در اين گزارش تلاش شده است تا با بررسي روشهاي مختلف ارائه شده يك طبقهبندي از روشهاي آموزش مدلها به صورت توزيعشده ارائه شود و مزايا و معايب روشهاي ارائه شده بيان شود. در نهايت نيز با بررسيهاي انجام شده، زمينههاي باز تحقيقاتي در رابطه با اين مساله مورد بررسي قرار ميگيرند.
-
نام دانشجو
مطهره ميرزائي
-
تاريخ ارائه
11/15/2023 12:00:00 AM
-
متن كامل
81098
-
پديد آورنده
مطهره ميرزايي
-
تاريخ ورود اطلاعات
1402/09/06
-
عنوان به انگليسي
A Survey on Distributed Training Approaches for Deep Neural Networks
-
كليدواژه هاي فارسي
آموزش توزيعشده , شبكههاي عصبي , گرههاي ناهمسان , اجماع نظر
-
كليدواژه هاي لاتين
Distributed Training , Neural Networks , Heterogeneous Nodes , Consensus
-
لينک به اين مدرک :