• شماره ركورد
    27377
  • پديد آورنده

    اميرحسين قاسمي

  • عنوان
    كنترل سيستم هاي چندعاملي به كمك يادگيري تقويتي انتقالي
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق//كنترل
  • سال تحصيل
    1399-1401
  • تاريخ دفاع
    1401/6/31
  • استاد راهنما
    دكتر حسين بلندي
  • دانشكده
    مهندسي برق
  • چكيده
    امروزه براي حل بسياري از مسائل، از سيستم‌هاي چندعاملي مشاركتي استفاده مي‌شود كه در آن گروهي از عامل‌ها براي رسيدن به يك هدف مشترك همكاري مي‌كنند. همكاري ميان عاملها فوايدي همچون كاهش هزينه‌هاي عملياتي، مقياس‌پذيري بالا و سازگاري قابل‌توجه را به ارمغان خواهد آورد. براي آموزش اين عامل‌ها در رسيدن به يك سياست بهينه، از يادگيري تقويتي بهره خواهند گرفت. يادگيري در محيط‌هاي چندعاملي مشاركتي پويا، غيرقطعي و با اندازه فضاي حالت بزرگ به يك چالش بسيار مهم در برنامه‌هاي كاربردي تبديل شده است. ازجمله اين چالش‌ها مي‌توان به تأثير اندازه فضاي حالت بر مدت‌زمان يادگيري و همچنين همكاري ناكارآمد ميان عامل‌ها و عدم وجود هماهنگي مناسب در تصميم‌گيري عامل‌ها اشاره كرد. همچنين هنگام استفاده از الگوريتم‌هاي يادگيري تقويتي نيز با چالش‌هايي نظير دشواري تعيين هدف يادگيري مناسب و زمان طولاني همگرايي ناشي از يادگيري مبتني بر آزمايش‌وخطا مواجه خواهيم بود. در اين پايان¬نامه با استفاده از يادگيري انتقالي در يادگيري تقويتي و به‌اشتراك‌گذاري دانش ميان عامل‌ها سعي شده تا الگوريتم جديدي پيشنهاد شود تا بتواند به‌صورت هم‌زمان از كارائي سيستم‌هاي چندعاملي و يادگيري تقويتي بهره برده و داراي نتايج بهتري نسبت به سيستم تك عاملي باشد. واژه‌هاي كليدي: سيستم‌هاي چندعاملي مشاركتي، يادگيري تقويتي، يادگيري انتقالي
  • تاريخ ورود اطلاعات
    1401/08/18
  • عنوان به انگليسي
    Control of multi-agent systems using transfer reinforcement learning
  • تاريخ بهره برداري
    9/22/2023 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    اميرحسين قاسمي

  • چكيده به لاتين
    Today, to solve many problems, cooperative multi-agent systems are used, in which a group of agents cooperate to reach a common goal. Cooperation between agents will bring benefits such as reduced operational costs, high scalability and significant adaptability. To train these agents in reaching an optimal policy, they will benefit from reinforcement learning. The issue of learning in dynamic, non-deterministic and large state space collaborative multi-agent environments has become a very important challenge in applications. Among these challenges, we can mention the effect of the size of the state space on the duration of learning, as well as the inefficient cooperation between the agents and the lack of proper coordination in the decision-making of the agents. Also, when using reinforcement learning algorithms, we will face challenges such as the difficulty of determining the appropriate learning goal and the long convergence time caused by trial and error based learning. In this thesis, by using transfer learning in reinforcement learning and sharing knowledge between agents, a new algorithm has been proposed so that it can simultaneously benefit from the efficiency of multi-agent systems and reinforcement learning and have better results than the single-agent system. Keywords: collaborative multi-agent systems, reinforcement learning, transfer learning
  • كليدواژه هاي فارسي
    سيستم‌هاي چندعاملي مشاركتي , يادگيري تقويتي , يادگيري انتقالي
  • كليدواژه هاي لاتين
    collaborative multi-agent systems , reinforcement learning , transfer learning
  • Author
    Amirhossein Ghasemi
  • SuperVisor
    Dr.Hossein Bolandi