-
شماره ركورد
23437
-
پديد آورنده
سيد امير قلري
-
عنوان
كنترل
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق كنترل
-
سال تحصيل
1399-1400
-
تاريخ دفاع
28/11/1399
-
استاد راهنما
دكتر سيد مجيد اسماعيل زاده
-
استاد مشاور
دكتر سيد مجي اسماعيل زاده
-
دانشكده
برق
-
چكيده
يادگيري تقويتي به عنوان زيرشاخهاي از علم يادگيري ماشين، روشي نوين در زمينه هوش مصنوعي و كامپيوتر به حساب ميآيد. اين روش با الهام گرفتن از نحوه يادگيري موجودات در طبيعت و تعامل آنها با محيط پيرامون خود، الگوريتمهاي متنوعي را ارائه ميدهد. با گذشت زمان يادگيري تقويتي با ارائه الگوريتمهاي بهينهسازي آنلاين، نظر محققان مهندسي كنترل را به اين نوع يادگيري بيش از پيش جلب كرد. تعميم روشهاي يادگيري تقويتي به سيستمهاي پيوسته زمان بر خلاف سيستمهاي گسسته زمان كاري دشوار ميباشد.
امروزه استفاده از بازوهاي انعطاف پذير، در صنايع مختلفي از جمله پزشكي، هوافضا و ... رو به افزايش بوده و دانش چگونگي پاسخ به مسائل ايجاد شده در اين حوزه نيز بسيار ضروري ميباشد. بازوي انعطاف پذير در حقيقت يك بازوي رباتيكي بوده كه داراي طول بسيار زياد و قطر كم است. چنين بازويي نسبت به بازوي داراي ساختار صلب، داراي مسائل پيچيده تري در حوزه كنترل خود ميباشد. كنترل ارتعاشات ايجاد شده در هنگام فعاليت اين ساختارها از جمله چالشهاي قابل بحث و مهم در حوزه كنترل اين سيستمها ميباشد.
در اين پاياننامه، يك روش تطبيقي بهينه مقيد به كمك روش يادگيري تقويتي جهت كنترل آنلاين سيستمهاي غيرخطي زمان پيوسته با معادلات اَفاين و ديناميك نيمه معلوم ارائه ميگردد. سيگنال كنترلي به دست آمده در انتهاي فرآيند يادگيري به مقدار بهينه خود همگرا ميشود و دامنه آن از حد اشباع تعريف شده در مساله فراتر نميرود. در گام بعدي اين كنترلكننده جهت كنترل آنلاين و كاهش ارتعاشات لينك انعطافپذير مورد استفاده قرار ميگيرد و نتايج به دست آمده درستي و موثر بودن روش ارائه شده را تاييد ميكنند.
-
تاريخ ورود اطلاعات
1400/01/21
-
عنوان به انگليسي
كنترل و كاهش ارتعاشات بازوي انعطافپذير بر اساس روش يادگيري تقويتي
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سيدامير قلري
-
چكيده به لاتين
Reinforcement learning as a sub-branch of machine learning science, is a new method in the field of artificial intelligence and computer. Inspired by how creatures learn in nature and how they interact with their environment, this method offers a variety of algorithms. Over time, reinforcement learning with the introduction of online optimization algorithms has attracted the attention of control engineering researchers to this type of learning more than ever. Unlike discrete time systems, it is difficult to generalize reinforcement learning methods to continuous time systems.
Today, the use of flexible manipulators is increasing in various industries such as medicine, aerospace, etc., and knowledge of how to respond to the problems created in this area is also very essential. The flexible manipulator is actually a robotic arm that is very long and small in diameter. Such a flexible link has more complex problems in its area of control than a link with a rigid structure. Controlling vibrations generated during the operation of these structures is one of the most debatable and important challenges in the field of control systems.
In this thesis, an online constrained optimal adaptive control method based on the reinforcement learning for partially-unknown nonlinear continuous-time systems with affine equations is presented. The control signal converges to its optimal value at the end of the learning process and its amplitude does not exceed the saturation limit defined in the problem. Next this controller has been used for online control and vibration suppression of a flexible link, and the results confirm the accuracy and effectiveness of the proposed method.
-
كليدواژه هاي فارسي
يادگيري تقويتي , كنترل تطبيقي بهينه مقيد , بازوي انعطافپذير , سيستم پيوسته زمان
-
كليدواژه هاي لاتين
Reinforcement learning , constrained optimal adaptive control , flexible link , continuous-time system
-
لينک به اين مدرک :