• شماره ركورد
    5304
  • عنوان
    انتقال دانش در يادگيري تقويتي عميق
  • سال تحصيل
    1396
  • استاد راهنما
    دكتر آنالويي
  • چکيده
    چكيده يادگيري تقويتي1 نوعي از يادگيري ماشين و تكنيكي عمومي جهت هوشممن امازي عامم 2 هسمت هما از ويژگي تعام با محيط با عنوان اااس و پاياي تئوري يادگيري خود ااتفاده ميهن . در حال حاضر مت هاي مبتني بر يادگيري تقويتي توانستاان در بسياري از زميناها با موفقيتهاي چشم گيري دامت پيم ا هننم . يادگيري تقويتي را ميتوان با عنوان يكي از گزيناهاي مه جهت داتيابي با عام هوشمن خودمختار با شمار آورد. يكي از چالشهاي عم ه در يادگيري تقويتي هن بودن اين روشها اات. اين چالش بما افمزايش پيچي گي مسئلا نمود بيشتري پي ا ميكن . تا هنون روشهاي متنوعي جهت بهبود ارعت در هنمار افمزايش هارايي الگوريت هاي يادگيري تقويتي ارائا ش ه اات ها يكي از اين روشها انتقال دانش ب ات آم ه در يك مسئلا با مسئلا ديگر اات. انتقال دانش داتا خاصي از روش هاي يادگيري ماشين ميباشن ها با ااتخراج دانش از يك وظيفما و انتقال آن با وظيفا اي ديگر ميپردازد. با توجا با افمزايش پيچيم گي مسمائ و همچنمين اهميمت امرعت يادگيري در هنار افزايش هارايي، انتقال دانش مورد توجا بسياري قرار گرفتااات. دانش در يادگيري تقويتي در مق ار ارزش بادات آم ه تواط عام در طول يادگيرياش يا ج ول ارزش حالت-عم و يا وزنهاي مربوط با شبكا)تابع تخمين( ذخيره ميشود. عام با امعي و خطما و انامام دادن عم هاي مختلف و دريافت پاداش يا جريما از محميط، دانمش خمود را بماروز ميهنم . در انتقمال دانمش در يادگيري تقويتي ه ف انتقال اين دانش و ااتفاده از آن در مسائ ديگر اات. اين مطالعا با برراي گروههاي مختلفي از روشهاي انتقال دانش پرداختا اات از جملما انتقمال دانمش بين دو وظيفا با اعمال و متغيرهاي حالت3 يكسان،ااتفاده از دانش عام آموزشدي ه بمراي آمموزش عامم ناهمگون4 ديگر، مارد اازي5 دانش و انتقال آن، روش انتقال بر اااس ماموعا قوانين ممنوع. تمرهز اصلي اين مطالعا بر روي روشهاي ارائا ش ه در بخش انتقال دانش بين دو وظيفا با اعمال و متغيرهماي حالمت6 يكسان اات. در پايان مطالعا مشاه ه گردي ها روشهاي پيشنهاد ش ه تا هنون با توجما بما فرضياتشمان بهبودهماي چش گيري در افزايش ارعت و دقت با همراه داشتاان ، اما با دلي فرضيات متنوع در هر يك امكان مقايسا دقيق بين روشها وجود ن ارد. ترهيب اين روشها با يك يگر و يا حتي روشهاي ديگر موجود جهت افمزايش ارعت و دقت، ميتوان باعث پيشرفتهاي بيشتري گردد. ها ميتوان اين نوع الگوريت هاي ترهيبي را يكي از گزيناهاي اصلي تحقيقات آين ه دانست. واژههاي كليدي يادگيري تقويتي، يادگيري تقويتي عميق، انتقال دانش
  • نام دانشجو

    سروش جاودان

  • تاريخ ارائه
    11/21/2018 12:00:00 AM
  • متن كامل
    57494
  • پديد آورنده

    سروش جاودان

  • تاريخ ورود اطلاعات
    1397/09/17