شماره ركورد
22630
پديد آورنده
محمد امين مرادي
عنوان
طراحي كنترل كننده ردياب بهينه چندمدله براي سيستم غيرخطي بر مبناي يادگيري تقويتي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
كنترل
سال تحصيل
1397
تاريخ دفاع
1399/4/10
استاد راهنما
دكتر سعيد شمقدري
دانشكده
برق
چكيده
بهمنظور استقلال از دانش ديناميك سيستم در كنترل سيستمهاي خطي و غيرخطي، رويكردهاي زيادي بهعنوان سيستمهاي مستقل از مدل يا مبتني برداده مطرحشدهاند. در مفهوم مهندسي كنترل، يادگيري تقويتي فضاي خالي بين كنترل تطبيقي سنتي و الگوريتمهاي كنترل بهينه را تا حدي پر ميكند. هدف يادگيري سياست بهينه و تابع مقدار براي يك سيستم فيزيكي داراي عدم قطعيت است. برخلاف كنترل بهينهي سنتي، يادگيري تقويتي راهحل مسئله HJB را بهصورت آنلاين محاسبه ميكند. يادگيري تقويتي در مهندسي كنترل، تاكنون كاربردهاي گستردهاي داشته و مبحث كنترل بهينه چندمدله و بهخصوص كنترل تحملپذير خطا عرصهاي است كه نياز به روشي مستقل از مدل در آن خودنمايي ميكند. بااينحال، طبق مطالعات صورت گرفته، با توجه به قديمي نبودن مباحث يادگيري تقويتي در كنترل، تاكنون پژوهش چندان زيادي در زمينه كنترل بهينه چندمدله با يادگيري تقويتي صورت نگرفته است و روشهاي ارائهشده نيز، داراي نقايص و دشواريهايي هستند كه استفاده از آنها را در كاربرد گسترده دچار مشكل ميكند. اين پژوهش، مبتني بر روش موجود در تركيب الگوريتمهاي يادگيري تقويتي و خوشهبندي ART ميباشد تا تغييرات در ديناميك محيط را باهدف كنترل بهينه سيستمهاي چندمدله بررسي نمايد. برجستهترين مشكل روشهاي موجود حجم محاسباتي بالا و سرعت پايين براي سيستمهاي پيچيدهتر ميباشد. روش ارائهشده در اين پژوهش با هدف كنترل تحملپذير خطا و در نظر گرفتن خطاهاي پيشبينيشده و بهمنظور كاهش حجم محاسباتي و حفظ عملكرد برخط سيستم كنترلي ميباشد. در بخش شبيهسازي، روش پيشنهادي با روش كلاسيك مورد مقايسه قرارگرفته است. نتايج حاصل كارايي روش ارائهشده را در كنترل بهينه سيستمهاي چندمدله نشان ميدهد.
تاريخ ورود اطلاعات
1399/08/07
عنوان به انگليسي
Design of an Optimal Multi-model Tracking Controller for a Non-Linear System – A Reinforcement Learning Approach
تاريخ بهره برداري
6/30/2020 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محمدامين مرادي
چكيده به لاتين
In order to be independent of the knowledge of system dynamics in the control of linear and nonlinear systems, many approaches have been proposed as model-independent or data-based systems. In the concept of control engineering, reinforcement learning fills the gap between traditional adaptive control and optimal control algorithms to some extent. The goal is to learn the optimal policy and value function for a physical system with uncertainty. Contrary to traditional optimal control, reinforcement learning calculates the solution to the HJB problem online. Reinforcement learning in control engineering has been widely used so far, and the issue of optimal multi-model control, especially fault-tolerant control, is an area in which the need for a model-independent method is evident. However, according to studies, due to the fact that the topics of reinforcement learning in control are not old, not much research has been done on the optimal control of multimodal learning with reinforcement learning, and the proposed methods have drawbacks and difficulties that use them in application. Widespread trouble. This research is based on the existing method in combining reinforcement learning algorithms and ART clustering to investigate changes in environmental dynamics with the aim of optimal control of multimodal systems. The most prominent problem of existing methods is the high computational volume and low speed for more complex systems. The method presented in this research aims to control the tolerable error and to consider the predicted errors in order to reduce the computational volume and maintain the online performance of the control system. In the simulation section, the proposed method is compared with the classical method. The results show the efficiency of the proposed method in the optimal control of multimodal systems.
كليدواژه هاي فارسي
يادگيري تقويتي , كنترل ردياب