سينا باقري نژاد

شماره ركورد
7989
عنوان
مطالعه و بررسي مقياس پذيري در الگوريتم هاي يادگيري تقويتي چند عامله
سال تحصيل
99-1400
استاد راهنما
دكتر ناصر مزيني
چکيده
در چند سال گذشته، در نتيجه بهبود توان محاسباتي، چارچوب يادگيري ماشين مي‌تواند به مجموعه داده‌هاي بزرگ‌تر اعمال شود. يادگيري تقويتي گروهي از الگوريتم‌هاي يادگيري ماشين است كه همچون يادگيري بدون نظارت، در آن عامل پاسخ صحيح را از قبل نمي‌داند. با اين حال، در مقايسه با يادگيري بدون نظارت، كيفيت يك تصميم مي‌تواند به عنوان يك عدد محاسبه شود. با سعي و خطا، يك برنامه مي‌تواند تصميمات بهينه را براساس اين معيار بيابد. چارچوب يادگيري تقويتي براي حل مشكلات پيچيده در محيط‌هاي بازي و سيستم‌هاي كنترل نشان‌داده شده‌است. در اين كار ما به مطالعه و بررسي چارچوب سيستمهاي چندعاملي و الگوريتم هايي كه براي يادگيري در چنين سيستم هايي تعبيه شده اند پرداخته ايم. همچنين مسئله مقياس پذيري اين الگوريتمها كه يكي از چالشهاي اين حوزه است را مورد بررسي قرار داده و مثال هايي از پژوهشهاي اخير در خصوص چگونگي حل اين چالش را معرفي كرده ايم و در انتها به معرفي چند مسئله براي پژوهش هاي آتي پرداخته ايم.
نام دانشجو
سينا باقري نژاد
تاريخ ارائه
12/21/2020 12:00:00 AM
متن كامل
69924
پديد آورنده
سينا باقري نژاد
تاريخ ورود اطلاعات
1399/10/23
عنوان به انگليسي
A review of Scalability in Multi-Agent Reinforcement Learning (MARL)
كليدواژه هاي فارسي
يادگيري در سيستمهاي چندعاملي , يادگيري تقويتي , مقياس پذيري
كليدواژه هاي لاتين
Learning in Multi-agent systems , Reinforcement learning , Scalability
لينک به اين مدرک :
http://dl.iust.ac.ir/dL/search/default.aspx?Term=7989&Field=0&DTC=14

کلیه حقوق این اثر برای شرکت مهندسی ارتباطات پيام مشرق محفوظ می باشد