شماره ركورد
10263
عنوان
بررسي روش هاي يادگيري تقويتي عميق باهدف غلبه بر مسئلهي تعدد ابعاد
سال تحصيل
1400
استاد راهنما
دكتر ناصر مزيني
چکيده
در يادگيري تقويتي وقتي فضاي مسئله ابعاد بالايي داشته باشد، الگوريتمهاي موجود از مشكل "تعدد ابعاد " رنج مي¬برند و با افزايش ابعاد محيط، كار آيي آنها كاهش مي¬يابد. براي محيط¬هاي پيچيده، تعداد حالات مختلف وضعيت محيط زياد و در بعضي مواقع نامتناهي است. اين معضل خصوصاً در محيط¬هاي پيوسته بدتر خواهد شد. با اين شرايط، فرآيند يادگيري بسيار وقت¬گير و پرهزينه ميشود و كيفيت نهايي عامل نيز افت پيدا مي¬كند. موفقيت يادگيري تقويتي در حوزه رباتيك دنياي واقعي، در بسياري از موارد محدود به سناريوهاي آزمايشگاهي بوده است، كه اغلب به تلاش و نظارت انساني براي ايجاد امكان يادگيري نياز دارد. در صورت استفاده از محيط دنياي واقعي براي يادگيري، عامل در نگاشت اطلاعات و استفاده از ابعاد وسيع دچار چالش ميشود.
راهحلهاي مختلفي براي حل اين مشكلات ارائه دادهشده است. ما در اين سمينار به بررسي و مرور تعدادي از مطالعات انجامشده در اين حوزه مي¬پردازيم كه شامل روش¬هاي يادگيري¬تقويتي سلسله¬مراتبي، يادگيري تقويتي بازگشتي و انواع الگوريتم¬هاي يادگيري تقويتي عميق است. در انتها به مقايسه الگوريتم-هاي موجود و نارسايي¬هاي آنها مي¬پردازيم.
نام دانشجو
ايسان پورعلي
تاريخ ارائه
12/1/2021 12:00:00 AM
متن كامل
73421
پديد آورنده
ايسان پورعلي
تاريخ ورود اطلاعات
1400/09/26
عنوان به انگليسي
A Review on deep reinforcement learning methods Aiming to overcome the Dimensionality proble
كليدواژه هاي فارسي
يادگيري تقويتي , يادگيري تقويتي عميق , چالش نفرين ابعاد , تعدد ابعاد
كليدواژه هاي لاتين
Reinforcement Learning , Deep Reinforcement Learning , curse of Dimensionality