-
شماره ركورد
10263
-
عنوان
بررسي روش هاي يادگيري تقويتي عميق باهدف غلبه بر مسئلهي تعدد ابعاد
-
سال تحصيل
1400
-
استاد راهنما
دكتر ناصر مزيني
-
چکيده
در يادگيري تقويتي وقتي فضاي مسئله ابعاد بالايي داشته باشد، الگوريتمهاي موجود از مشكل "تعدد ابعاد " رنج مي¬برند و با افزايش ابعاد محيط، كار آيي آنها كاهش مي¬يابد. براي محيط¬هاي پيچيده، تعداد حالات مختلف وضعيت محيط زياد و در بعضي مواقع نامتناهي است. اين معضل خصوصاً در محيط¬هاي پيوسته بدتر خواهد شد. با اين شرايط، فرآيند يادگيري بسيار وقت¬گير و پرهزينه ميشود و كيفيت نهايي عامل نيز افت پيدا مي¬كند. موفقيت يادگيري تقويتي در حوزه رباتيك دنياي واقعي، در بسياري از موارد محدود به سناريوهاي آزمايشگاهي بوده است، كه اغلب به تلاش و نظارت انساني براي ايجاد امكان يادگيري نياز دارد. در صورت استفاده از محيط دنياي واقعي براي يادگيري، عامل در نگاشت اطلاعات و استفاده از ابعاد وسيع دچار چالش ميشود.
راهحلهاي مختلفي براي حل اين مشكلات ارائه دادهشده است. ما در اين سمينار به بررسي و مرور تعدادي از مطالعات انجامشده در اين حوزه مي¬پردازيم كه شامل روش¬هاي يادگيري¬تقويتي سلسله¬مراتبي، يادگيري تقويتي بازگشتي و انواع الگوريتم¬هاي يادگيري تقويتي عميق است. در انتها به مقايسه الگوريتم-هاي موجود و نارسايي¬هاي آنها مي¬پردازيم.
-
نام دانشجو
ايسان پورعلي
-
تاريخ ارائه
12/1/2021 12:00:00 AM
-
متن كامل
73421
-
پديد آورنده
ايسان پورعلي
-
تاريخ ورود اطلاعات
1400/09/26
-
عنوان به انگليسي
A Review on deep reinforcement learning methods Aiming to overcome the Dimensionality proble
-
كليدواژه هاي فارسي
يادگيري تقويتي , يادگيري تقويتي عميق , چالش نفرين ابعاد , تعدد ابعاد
-
كليدواژه هاي لاتين
Reinforcement Learning , Deep Reinforcement Learning , curse of Dimensionality
-
لينک به اين مدرک :