• شماره ركورد
    10263
  • عنوان
    بررسي روش هاي يادگيري تقويتي عميق باهدف غلبه بر مسئله‌ي تعدد ابعاد
  • سال تحصيل
    1400
  • استاد راهنما
    دكتر ناصر مزيني
  • چکيده
    در يادگيري تقويتي وقتي فضاي مسئله ابعاد بالايي داشته باشد، الگوريتم‌هاي موجود از مشكل "تعدد ابعاد " رنج مي¬برند و با افزايش ابعاد محيط، كار آيي آن‌ها كاهش مي¬يابد. براي محيط¬هاي پيچيده، تعداد حالات مختلف وضعيت محيط زياد و در بعضي مواقع نامتناهي است. اين معضل خصوصاً در محيط¬هاي پيوسته بدتر خواهد شد. با اين شرايط، فرآيند يادگيري بسيار وقت¬گير و پرهزينه مي‌شود و كيفيت نهايي عامل نيز افت پيدا مي¬كند. موفقيت يادگيري تقويتي در حوزه رباتيك دنياي واقعي، در بسياري از موارد محدود به سناريوهاي آزمايشگاهي بوده است، كه اغلب به تلاش و نظارت انساني براي ايجاد امكان يادگيري نياز دارد. در صورت استفاده از محيط دنياي واقعي براي يادگيري، عامل در نگاشت اطلاعات و استفاده از ابعاد وسيع دچار چالش مي‌شود. راه‌حل‌هاي مختلفي براي حل اين مشكلات ارائه داده‌شده است. ما در اين سمينار به بررسي و مرور تعدادي از مطالعات انجام‌شده در اين حوزه مي¬پردازيم كه شامل روش¬هاي يادگيري¬تقويتي سلسله¬مراتبي، يادگيري تقويتي بازگشتي و انواع الگوريتم¬هاي يادگيري تقويتي عميق است. در انتها به مقايسه الگوريتم-هاي موجود و نارسايي¬هاي آن‌ها مي¬پردازيم.
  • نام دانشجو

    ايسان پورعلي

  • تاريخ ارائه
    12/1/2021 12:00:00 AM
  • متن كامل
    73421
  • پديد آورنده

    ايسان پورعلي

  • تاريخ ورود اطلاعات
    1400/09/26
  • عنوان به انگليسي
    A Review on deep reinforcement learning methods Aiming to overcome the Dimensionality proble
  • كليدواژه هاي فارسي
    يادگيري تقويتي , يادگيري تقويتي عميق , چالش نفرين ابعاد , تعدد ابعاد
  • كليدواژه هاي لاتين
    Reinforcement Learning , Deep Reinforcement Learning , curse of Dimensionality