-
شماره ركورد
33443
-
پديد آورنده
محمدرسول كنكاشور
-
عنوان
طراحي كنترلكننده تطبيقي بهينه مبتني بر روش يادگيري تقويتي براي آرايش پروازي ماهوارهها
-
مقطع تحصيلي
دكتري
-
رشته تحصيلي
برق
-
سال تحصيل
1395
-
تاريخ دفاع
1404/01/27
-
استاد راهنما
حسين بلندي
-
استاد مشاور
ناصر مزيني
-
دانشكده
برق
-
چكيده
آرايش پروازي ماهوارهها به دليل مزاياي آن در انجام مأموريتهاي پيچيده فضايي كه با يك ماهواره منفرد قابل انجام نيست، در سالهاي اخير مورد توجه فراوان قرار گرفته است. كنترل اين آرايشها به دليل ديناميك غيرخطي، عدم قطعيتها و اغتشاشات مداري محيط فضايي، چالشهاي قابل توجهي را ايجاد ميكند. علاوه بر اين، مأموريتهاي فضايي نيازمند سطوح بالايي از قابليت اطمينان و تحملپذيري عيب هستند. روشهاي كنترلي سنتي اغلب به مدلهاي دقيق سيستم متكي هستند كه در عمل ممكن است فراهم نباشد. در اين رساله، روشهاي نويني براي كنترل تطبيقي بهينه آرايش پروازي ماهوارهها مبتني بر يادگيري تقويتي پيشنهاد شده است. با بهكارگيري الگوريتمهاي يادگيري تقويتي، بهويژه يادگيري-كيو، كنترلكنندههايي طراحي شدهاند كه ميتوانند سياستهاي كنترلي بهينه را بدون نياز به مدل دقيق سيستم بياموزند. اين رويكرد به كنترلكنندهها اجازه ميدهد تا به عدم قطعيتها و تغييرات پارامتري سيستم سازگار شوند و عملكرد مطلوبي را در مواجهه با عيبها ارائه دهند. در طراحي كنترلكنندهها از ساختار بازيگر-منتقد استفاده شده و اثبات پايداري آنها با بهرهگيري از تئوري لياپانوف انجام شده است. توابع هزينه به صورت عموميسازيشده طراحي شدهاند تا معيارهاي مختلفي مانند بهينهسازي مصرف سوخت، دقت موقعيتيابي و حفظ هندسه آرايش را در بر گيرند. اين امر امكان بهينهسازي همزمان چندين معيار عملكردي را فراهم ميكند. علاوه بر اين، كنترلكنندههاي تحملپذير عيب با استفاده از فيدبك حالت و فيدبك خروجي طراحي شدهاند كه در مواجهه با عيبهاي سنسورها و عملگرها، عملكرد مطلوب سيستم را حفظ ميكنند. يك الگوريتم تشخيص، جداسازي و بازيابي عيب (FDIR) توسعه يافته است تا قابليت اطمينان و ايمني سيستم افزايش يابد. اين كنترلكنندهها قادرند به صورت تطبيقي با عيبهاي سيستم سازگار شوند و از كاهش كارايي سيستم جلوگيري كنند. روشهاي پيشنهادي در زمينه آرايش پروازي ماهوارهها پيادهسازي و ارزيابي شدهاند. نتايج شبيهسازيها نشان ميدهد كه استفاده از يادگيري تقويتي در طراحي كنترلكنندههاي بهينه و تحملپذير عيب، منجر به بهبود قابلتوجهي در عملكرد سيستم ميشود. كنترلكنندههاي طراحيشده نه تنها قادر به حفظ آرايش مطلوب ماهوارهها هستند، بلكه در مواجهه با عيبهاي احتمالي و اغتشاشات مداري، عملكرد سيستم را تضمين ميكنند. اين پژوهش با ارائه راهكارهاي عملي و نوآورانه براي مأموريتهاي فضايي آينده، به پيشرفت روشهاي كنترلي در سيستمهاي فضايي كمك ميكند. استفاده از روشهاي يادگيري تقويتي و طراحي كنترلكنندههاي تطبيقي بهينه، راهكاري مؤثر براي مقابله با پيچيدگيها و عدم قطعيتهاي موجود در سيستمهاي فضايي ارائه ميدهد. اميد است كه نتايج اين تحقيق بتواند گامي موثر در جهت، ايمني و كارايي مأموريتها آرايش پروازي ماهوارهها منجر شود.
-
تاريخ ورود اطلاعات
1404/02/31
-
عنوان به انگليسي
Optimal Adaptive Controller Design Based on Reinforcement Learning Method for Satellite Formation Flying
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
محمدرسول كنكاشور
-
چكيده به لاتين
Satellite formation flying (SFF) has garnered significant attention in recent years owing to its advantages in executing complex space missions that are unfeasible with a single satellite. The control of such formations presents substantial challenges due to the inherently nonlinear dynamics, uncertainties, and perturbations pervasive in the space environment. Moreover, space missions demand stringent reliability and fault-tolerance levels. Traditional control methodologies predominantly rely on precise system models, which may not always be available in practical scenarios. In this dissertation, novel methodologies for optimal adaptive control of satellite formation flying, leveraging reinforcement learning, are proposed. Employing reinforcement learning algorithms, particularly Q-learning, controllers are developed that can autonomously learn optimal control policies without necessitating exact system models. This approach enables the controllers to adapt to system uncertainties and parametric variations, thereby maintaining robust performance in the presence of perturbations and faults. The proposed control architectures utilize an actor-critic framework, with their stability rigorously validated using Lyapunov theory. The cost functions are designed in a generalized manner to encapsulate multiple criteria, including fuel optimization, positional accuracy, and formation geometry preservation. This generalization facilitates the simultaneous optimization of multiple performance metrics. Additionally, fault-tolerant controllers based on state and output feedback mechanisms are designed to sustain optimal system performance amidst sensor and actuator faults. A fault detection, isolation, and recovery (FDIR) algorithm is developed to enhance the system's reliability and safety. These controllers exhibit the capability to adaptively accommodate system faults, preventing performance degradation. The proposed methodologies are implemented and evaluated within the context of satellite formation flying. Simulation results demonstrate that employing reinforcement learning in the design of optimal and fault-tolerant controllers yields significant performance enhancements. The controllers not only maintain the desired formation but also ensure system functionality under potential faults and perturbations. This research contributes to advancing practical and innovative strategies for future space missions. By integrating reinforcement learning into the design of optimal adaptive controllers, it addresses the complexities and uncertainties inherent in space systems. It is anticipated that the findings of this study will enhance the reliability, safety, and efficiency of satellite formation flying missions.
-
كليدواژه هاي فارسي
آرايش پروازي ماهوارهها , يادگيري تقويتي , كنترل تطبيقي بهينه , كنترل تحمل پذير عيب , يادگيري-كيو , سيستم جند عاملي , تشخيص، شناسايي عيب و بازيابي
-
كليدواژه هاي لاتين
Satellite Formation Flying , Reinforcement Learning , Optimal Adaptive Control , Fault-Tolerant Control , Q-learning , Multi-Agent Systems , Fault Detection, Isolation, and Recovery
-
Author
Mohammadrasoul Kankashvar
-
SuperVisor
Hossein Bolandi
-
لينک به اين مدرک :