چکيده
چكيده
يادگيري تقويتي1 نوعي از يادگيري ماشين و تكنيكي عمومي جهت هوشممن امازي عامم 2 هسمت هما از
ويژگي تعام با محيط با عنوان اااس و پاياي تئوري يادگيري خود ااتفاده ميهن . در حال حاضر مت هاي
مبتني بر يادگيري تقويتي توانستاان در بسياري از زميناها با موفقيتهاي چشم گيري دامت پيم ا هننم .
يادگيري تقويتي را ميتوان با عنوان يكي از گزيناهاي مه جهت داتيابي با عام هوشمن خودمختار با
شمار آورد. يكي از چالشهاي عم ه در يادگيري تقويتي هن بودن اين روشها اات. اين چالش بما افمزايش
پيچي گي مسئلا نمود بيشتري پي ا ميكن . تا هنون روشهاي متنوعي جهت بهبود ارعت در هنمار افمزايش
هارايي الگوريت هاي يادگيري تقويتي ارائا ش ه اات ها يكي از اين روشها انتقال دانش ب ات آم ه در يك
مسئلا با مسئلا ديگر اات.
انتقال دانش داتا خاصي از روش هاي يادگيري ماشين ميباشن ها با ااتخراج دانش از يك وظيفما و
انتقال آن با وظيفا اي ديگر ميپردازد. با توجا با افمزايش پيچيم گي مسمائ و همچنمين اهميمت امرعت
يادگيري در هنار افزايش هارايي، انتقال دانش مورد توجا بسياري قرار گرفتااات.
دانش در يادگيري تقويتي در مق ار ارزش بادات آم ه تواط عام در طول يادگيرياش يا ج ول ارزش
حالت-عم و يا وزنهاي مربوط با شبكا)تابع تخمين( ذخيره ميشود. عام با امعي و خطما و انامام دادن
عم هاي مختلف و دريافت پاداش يا جريما از محميط، دانمش خمود را بماروز ميهنم . در انتقمال دانمش در
يادگيري تقويتي ه ف انتقال اين دانش و ااتفاده از آن در مسائ ديگر اات.
اين مطالعا با برراي گروههاي مختلفي از روشهاي انتقال دانش پرداختا اات از جملما انتقمال دانمش
بين دو وظيفا با اعمال و متغيرهاي حالت3 يكسان،ااتفاده از دانش عام آموزشدي ه بمراي آمموزش عامم
ناهمگون4 ديگر، مارد اازي5 دانش و انتقال آن، روش انتقال بر اااس ماموعا قوانين ممنوع. تمرهز اصلي
اين مطالعا بر روي روشهاي ارائا ش ه در بخش انتقال دانش بين دو وظيفا با اعمال و متغيرهماي حالمت6
يكسان اات.
در پايان مطالعا مشاه ه گردي ها روشهاي پيشنهاد ش ه تا هنون با توجما بما فرضياتشمان بهبودهماي چش گيري در افزايش ارعت و دقت با همراه داشتاان ، اما با دلي فرضيات متنوع در هر يك امكان مقايسا
دقيق بين روشها وجود ن ارد. ترهيب اين روشها با يك يگر و يا حتي روشهاي ديگر موجود جهت افمزايش
ارعت و دقت، ميتوان باعث پيشرفتهاي بيشتري گردد. ها ميتوان اين نوع الگوريت هاي ترهيبي را يكي از
گزيناهاي اصلي تحقيقات آين ه دانست.
واژههاي كليدي يادگيري تقويتي، يادگيري تقويتي عميق، انتقال دانش