شماره ركورد

10263

عنوان

بررسي روش هاي يادگيري تقويتي عميق باهدف غلبه بر مسئله‌ي تعدد ابعاد

سال تحصيل

1400

استاد راهنما

دكتر ناصر مزيني

چکيده

در يادگيري تقويتي وقتي فضاي مسئله ابعاد بالايي داشته باشد، الگوريتم‌هاي موجود از مشكل "تعدد ابعاد " رنج مي¬برند و با افزايش ابعاد محيط، كار آيي آن‌ها كاهش مي¬يابد. براي محيط¬هاي پيچيده، تعداد حالات مختلف وضعيت محيط زياد و در بعضي مواقع نامتناهي است. اين معضل خصوصاً در محيط¬هاي پيوسته بدتر خواهد شد. با اين شرايط، فرآيند يادگيري بسيار وقت¬گير و پرهزينه مي‌شود و كيفيت نهايي عامل نيز افت پيدا مي¬كند. موفقيت يادگيري تقويتي در حوزه رباتيك دنياي واقعي، در بسياري از موارد محدود به سناريوهاي آزمايشگاهي بوده است، كه اغلب به تلاش و نظارت انساني براي ايجاد امكان يادگيري نياز دارد. در صورت استفاده از محيط دنياي واقعي براي يادگيري، عامل در نگاشت اطلاعات و استفاده از ابعاد وسيع دچار چالش مي‌شود. راه‌حل‌هاي مختلفي براي حل اين مشكلات ارائه داده‌شده است. ما در اين سمينار به بررسي و مرور تعدادي از مطالعات انجام‌شده در اين حوزه مي¬پردازيم كه شامل روش¬هاي يادگيري¬تقويتي سلسله¬مراتبي، يادگيري تقويتي بازگشتي و انواع الگوريتم¬هاي يادگيري تقويتي عميق است. در انتها به مقايسه الگوريتم-هاي موجود و نارسايي¬هاي آن‌ها مي¬پردازيم.

نام دانشجو

ايسان پورعلي

Name: ايسان پورعلي
Author: ايسان پورعلي

تاريخ ارائه

12/1/2021 12:00:00 AM

متن كامل

73421

پديد آورنده

ايسان پورعلي

تاريخ ورود اطلاعات

1400/09/26

عنوان به انگليسي

A Review on deep reinforcement learning methods Aiming to overcome the Dimensionality proble

كليدواژه هاي فارسي

يادگيري تقويتي , يادگيري تقويتي عميق , چالش نفرين ابعاد , تعدد ابعاد

كليدواژه هاي لاتين

Reinforcement Learning , Deep Reinforcement Learning , curse of Dimensionality

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=10263&Field=0&DTC=14