-
شماره ركورد
27409
-
پديد آورنده
عليرضا موسوي
-
عنوان
كنترل اجماعي سيستم هاي غيرخطي چندعاملي با تلفيق روش هاي لغزشي-فازي-تطبيقي و يادگيري تقويتي
-
مقطع تحصيلي
دكتري
-
رشته تحصيلي
مهندسي مكانيك
-
سال تحصيل
1395
-
تاريخ دفاع
1401/7/27
-
استاد راهنما
اميرحسين دوائي مركزي
-
دانشكده
مهندسي مكانيك
-
چكيده
در اين رساله، جهت حل مسأله كنترل اجماعي پيشرو-پيرو با هدف به حداقل رساندن توابع هزينه محلي، روش كنترل توزيع شده مبتني بر ايده لغزشي-فازي-تطبيقي با استفاده از يك الگوريتم يادگيري تقويتي با ساختار خارج از سياست و به كمك نظريه بازي گرافي توسعه داده شده است. در مسأله كنترل اجماعي پيشرو-پيرو، نامعلوم بودن معادلات ديناميكي حاكم بر رفتار عاملها طراحي قوانين كنترلي بهينه را با چالش هايي مضاعف مواجه مي كند. ضمن آنكه در اين مطالعه، ديناميك عامل ها غيرخطي فرض شده و امكان نابرابري بين تعداد وروديها و تعداد زيرسيستمهاي هرعامل نيز درنظر گرفته شده است (معادلات غيرمربعي).
در روش پيشنهادشده، تابع هزينه محلي هرعامل به صورت تابعي از بردار لغزش متناظر و ضرايب آن به عنوان سياست بهينه سازي درنظر گرفته مي شود. برخلاف روش هاي موجود يادگيري تقويتي خارج از سياست، كه براي مسأله اجماع مجموعه عامل هاي ديناميكي توسعه داده شده اند، روش پيشنهادشده بدون نياز به معادلات ديناميكي مجموعه سيستم و يا اطلاعات مرتبط با آن راه اندازي مي گردد. لازم به ذكر است كه در اين رويكرد و با استفاده از داده هاي ورودي-خروجي ثبت شده، از ساختار بازيگر-منتقد فازي به منظور محاسبه ضرايب مطلوب بردارهاي لغزش بهره گرفته مي شود. بنابراين، با بهره گيري از بردار لغزش مبتني بر ضرايب محاسبه شده، ورودي كنترلي هرعامل محاسبه مي گردد.
ورودي كنترلي پيشنهادي مجموعي از دو پايه مجزا است. اولي يك پايه فازي جهت تقريب برخط ديناميك سيستم و دومي يك پايه مقاومساز به منظور جبران خطاي تقريب و ساير عدم قطعيت هاست. بدين ترتيب، براساس بردارهاي لغزش محلي، خروجي هاي تك مقداري فازي و كران هاي بالاي خطاهاي تقريب به وسيله قوانين تطبيق و براساس قضيه دوم لياپانوف تقريب زده مي شوند. لازم به ذكر است كه پايداري مجانبي بردارهاي لغزش، براساس قضيه دوم لياپانوف و لم باربالات در شرايط وجود عدم قطعيت ها و اغتشاش هاي خارجي اثبات شده است. در ادامه نيز، به منظور حل مسأله در شرايط وجود قيدهاي حالت، ساختاري مبتني بر توابع مانع مرزي ارائه شده است. جهت بررسي عملكرد روش ارائه شده، مسأله كنترل چينش چندين وسيله زيرآبي خودمختار از نوع ريماس مورد مطالعه قرار گرفته است. نتايج شبيه سازي نشان دهنده عملكرد قابل قبول روش پيشنهادي در مقايسه با عملكرد ساختار لغزشي-فازي-تطبيقي به همراه بهينه سازي آرماني مبتني بر مدل معلوم بوده است. ضمن آنكه، در شرايط بهره گيري از كنترل لغزشي-فازي-تطبيقي مبتني بر توابع مانع مرزي، هدف كنترلي به همراه عدم تخطي در قيدهاي مربوط به متغيرهاي حالت محقق شده است.
-
تاريخ ورود اطلاعات
1401/09/03
-
عنوان به انگليسي
Consensus Control of Nonlinear Multi-agent Systems Using Adaptive Fuzzy Sliding-mode Control and Reinforcement Learning Methods
-
تاريخ بهره برداري
10/19/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
عليرضا موسوي
-
چكيده به لاتين
In this dissertation, to achieve the leader-follower consensus of multi-agent systems based on the minimization of the local cost functions, a distributed Adaptive Fuzzy Sliding-Mode Control (AFSMC) method is developed based on an off-policy reinforcement learning algorithm and the graphical game theory. Since the dynamics of the multi-agent systems are unknown, the design of optimal control laws for the leader-follower consensus problem is a challenging issue. Moreover, in this study, the dynamic equations of the agents are assumed to be nonlinear and the input gain matrices are nonsquare.
In the proposed method, the performance index of each agent is an explicit function of the local sliding vector and its corresponding coefficients as the optimization policies. Contrary to the conventional off-policy reinforcement learning algorithms for the consensus control of multi-agent systems, the proposed method does not require partial knowledge of the system dynamics to initialize the reinforcement learning process. Furthermore, the actor-critic fuzzy methodology is employed to approximate optimal policies using the measured input/output data. Therefore, by using the tuned sliding vector, the control input for each agent is generated which includes a fuzzy term and a robust term.
In the control input designed for each agent, the fuzzy term is employed to approximate an unknown nonlinear function including the effects of system dynamics. Moreover, the robust term is considered to compensate for any possible mismatches. Therefore, using the local sliding vectors, the output singletons of the fuzzy systems and the upper bounds of the approximation errors are computed by the adaptation laws. The closed-loop asymptotic stability of the sliding variables in the presence of disturbances and uncertainties is proved using the second Lyapunov theorem and the Barbalat’s lemma. In continuation, a barrier function-based method is proposed for the consensus problem in the presence of state constraints. The effectiveness of the proposed method in the leader-follower consensus control problem of a group of REMUS Autonomous Underwater Vehicles (AUVs) is evaluated through numerical simulations. According to the simulation results, the proposed control structure shows acceptable performance compared to the AFSMC with ideal sliding parameters which are obtained by a model-based optimization procedure. Moreover, by using the barrier function-based AFSMC, the control objective as well as the state constraint satisfaction are achieved.
-
كليدواژه هاي فارسي
اجماع پيشرو-پيرو , كنترل لغزشي-فازي-تطبيقي , يادگيري تقويتي خارج از سياست , نظريه بازي گرافي , سيستم فازي بازيگر-منتقد
-
كليدواژه هاي لاتين
leader-follower consensus , adaptive fuzzy sliding-mode control , off-policy reinforcement learning , graphical game theory , actor-critic fuzzy system
-
Author
Alireza Mousavi
-
SuperVisor
Amir Hossein Davaie Markazi
-
لينک به اين مدرک :