-
شماره ركورد
7989
-
عنوان
مطالعه و بررسي مقياس پذيري در الگوريتم هاي يادگيري تقويتي چند عامله
-
سال تحصيل
99-1400
-
استاد راهنما
دكتر ناصر مزيني
-
چکيده
در چند سال گذشته، در نتيجه بهبود توان محاسباتي، چارچوب يادگيري ماشين ميتواند به مجموعه دادههاي بزرگتر اعمال شود. يادگيري تقويتي گروهي از الگوريتمهاي يادگيري ماشين است كه همچون يادگيري بدون نظارت، در آن عامل پاسخ صحيح را از قبل نميداند. با اين حال، در مقايسه با يادگيري بدون نظارت، كيفيت يك تصميم ميتواند به عنوان يك عدد محاسبه شود. با سعي و خطا، يك برنامه ميتواند تصميمات بهينه را براساس اين معيار بيابد. چارچوب يادگيري تقويتي براي حل مشكلات پيچيده در محيطهاي بازي و سيستمهاي كنترل نشانداده شدهاست.
در اين كار ما به مطالعه و بررسي چارچوب سيستمهاي چندعاملي و الگوريتم هايي كه براي يادگيري در چنين سيستم هايي تعبيه شده اند پرداخته ايم. همچنين مسئله مقياس پذيري اين الگوريتمها كه يكي از چالشهاي اين حوزه است را مورد بررسي قرار داده و مثال هايي از پژوهشهاي اخير در خصوص چگونگي حل اين چالش را معرفي كرده ايم و در انتها به معرفي چند مسئله براي پژوهش هاي آتي پرداخته ايم.
-
نام دانشجو
سينا باقري نژاد
-
تاريخ ارائه
12/21/2020 12:00:00 AM
-
متن كامل
69924
-
پديد آورنده
سينا باقري نژاد
-
تاريخ ورود اطلاعات
1399/10/23
-
عنوان به انگليسي
A review of Scalability in Multi-Agent Reinforcement Learning (MARL)
-
كليدواژه هاي فارسي
يادگيري در سيستمهاي چندعاملي , يادگيري تقويتي , مقياس پذيري
-
كليدواژه هاي لاتين
Learning in Multi-agent systems , Reinforcement learning , Scalability
-
لينک به اين مدرک :