• شماره ركورد
    12786
  • عنوان
    بررسي رويكردهاي توزيع‌شده در آموزش شبكه‌هاي عصبي عميق
  • سال تحصيل
    1400
  • استاد راهنما
    دكتر مهرداد آشتياني
  • چکيده
    امروزه با توجه به اهميت مدل‌هاي پيش‌آموزش ديده مثل Bert و GPT3 و استفاده از ترانسفورمرها در هوش مصنوعي كه مدل‌هاي بزرگي محسوب مي‌شوند، اين نياز احساس مي‌شود كه به دنبال روشي بود تا سرعت آموزش اين مدل‌ها را افزايش داد. براي رسيدن به اين هدف، موضوع آموزش مدل‌ها به صورت توزيع‌شده مهم‌تر از گذشته شده‌است. همان‌طور كه از اسم آن مشخص است با استفاده از اين روش، مي‌توان آموزش مدل‌ها را روي چندين پردازنده‌ي گرافيكي انجام داد. اين روش براي تمام مدل‌ها مي‌تواند استفاده شود اما وجود آن براي مدل‌هايي كه آموزش آن‌ها به زمان و داده بيشتري نياز دارد، بيشتر احساس مي‌شود. يكي از مزاياي آموزش مدل‌ها با اين روش، حفظ حريم خصوصي افراد است. با توجه به كارهاي انجام‌ شده در آموزش مدل‌ها از تمام ظرفيت پردازنده‌هاي گرافيكي به صورت بهينه استفاده نمي‌شود و با توجه به اينكه اين منابع براي ما از اهميت بالايي برخوردارند، يكي از اهداف اين است كه بتوان به صورت بهينه از اين منابع استفاده كرد. از اين نظر كه ما براي آموزش اين مدل‌ها به مقدار زيادي داده نياز داريم و به طور مثال اگر اين داده‌ها مربوط به بيماران باشد با اين روش ديگر نيازي نيست داده‌ها به يك سرويس‌دهنده واحد منتقل شود و تنها وزن‌ها و مؤلفه‌هاي مدلي كه با آن داده‌ها آموزش داده‌ شده‌ است، منتقل مي‌شود. از طرفي روزبه‌روز حجم داده‌هايي كه توليد مي‌شوند در حال افزايش هستند و براي مدل‌هاي پيش‌‌آموزش‌ ديده، هر چه مقدار داده‌ي بيشتري را ديده‌ باشند، يك مزيت به شمار مي‌رود. به همين دليل اين موضوع مي‌تواند در جهت سرعت بخشيدن به آموزش مدل‌هاي بزرگ، نقش چشمگيري ايفا كند. در كارهاي انجام‌شده نكته‌اي كه كمتر در نظر گرفته‌شده، ناهمسان بودن گره‌ها است و در اكثر كارها فرض بر اين گذاشته‌شده كه گره‌ها همسان هستند كه اين فرض مي‌تواند اندكي با واقعيت متفاوت باشد. در اين گزارش تلاش شده است تا با بررسي روش‌هاي مختلف ارائه شده يك طبقه‌بندي از روش‌هاي آموزش مدل‌ها به صورت توزيع‌شده ارائه شود و مزايا و معايب روش‌هاي ارائه شده بيان شود. در نهايت نيز با بررسي‌هاي انجام شده، زمينه‌هاي باز تحقيقاتي در رابطه با اين مساله مورد بررسي قرار مي‌گيرند.
  • نام دانشجو

    مطهره ميرزائي

  • تاريخ ارائه
    11/15/2023 12:00:00 AM
  • متن كامل
    81098
  • پديد آورنده

    مطهره ميرزايي

  • تاريخ ورود اطلاعات
    1402/09/06
  • عنوان به انگليسي
    A Survey on Distributed Training Approaches for Deep Neural Networks
  • كليدواژه هاي فارسي
    آموزش توزيع‌شده , شبكه‌هاي عصبي , گره‌هاي ناهمسان , اجماع نظر
  • كليدواژه هاي لاتين
    Distributed Training , Neural Networks , Heterogeneous Nodes , Consensus