• شماره ركورد
    7989
  • عنوان
    مطالعه و بررسي مقياس پذيري در الگوريتم هاي يادگيري تقويتي چند عامله
  • سال تحصيل
    99-1400
  • استاد راهنما
    دكتر ناصر مزيني
  • چکيده
    در چند سال گذشته، در نتيجه بهبود توان محاسباتي، چارچوب يادگيري ماشين مي‌تواند به مجموعه داده‌هاي بزرگ‌تر اعمال شود. يادگيري تقويتي گروهي از الگوريتم‌هاي يادگيري ماشين است كه همچون يادگيري بدون نظارت، در آن عامل پاسخ صحيح را از قبل نمي‌داند. با اين حال، در مقايسه با يادگيري بدون نظارت، كيفيت يك تصميم مي‌تواند به عنوان يك عدد محاسبه شود. با سعي و خطا، يك برنامه مي‌تواند تصميمات بهينه را براساس اين معيار بيابد. چارچوب يادگيري تقويتي براي حل مشكلات پيچيده در محيط‌هاي بازي و سيستم‌هاي كنترل نشان‌داده شده‌است. در اين كار ما به مطالعه و بررسي چارچوب سيستمهاي چندعاملي و الگوريتم هايي كه براي يادگيري در چنين سيستم هايي تعبيه شده اند پرداخته ايم. همچنين مسئله مقياس پذيري اين الگوريتمها كه يكي از چالشهاي اين حوزه است را مورد بررسي قرار داده و مثال هايي از پژوهشهاي اخير در خصوص چگونگي حل اين چالش را معرفي كرده ايم و در انتها به معرفي چند مسئله براي پژوهش هاي آتي پرداخته ايم.
  • نام دانشجو

    سينا باقري نژاد

  • تاريخ ارائه
    12/21/2020 12:00:00 AM
  • متن كامل
    69924
  • پديد آورنده

    سينا باقري نژاد

  • تاريخ ورود اطلاعات
    1399/10/23
  • عنوان به انگليسي
    A review of Scalability in Multi-Agent Reinforcement Learning (MARL)
  • كليدواژه هاي فارسي
    يادگيري در سيستمهاي چندعاملي , يادگيري تقويتي , مقياس پذيري
  • كليدواژه هاي لاتين
    Learning in Multi-agent systems , Reinforcement learning , Scalability