• شماره ركورد
    23437
  • پديد آورنده

    سيد امير قلري

  • عنوان
    كنترل
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق كنترل
  • سال تحصيل
    1399-1400
  • تاريخ دفاع
    28/11/1399
  • استاد راهنما
    دكتر سيد مجيد اسماعيل زاده
  • استاد مشاور
    دكتر سيد مجي اسماعيل زاده
  • دانشكده
    برق
  • چكيده
    يادگيري تقويتي به عنوان زيرشاخه‌اي از علم يادگيري ماشين، روشي نوين در زمينه هوش مصنوعي و كامپيوتر به حساب مي‌آيد. اين روش با الهام گرفتن از نحوه يادگيري موجودات در طبيعت و تعامل آن‌ها با محيط پيرامون خود، الگوريتم‌هاي متنوعي را ارائه مي‌دهد. با گذشت زمان يادگيري تقويتي با ارائه الگوريتم‌هاي بهينه‌سازي آنلاين، نظر محققان مهندسي كنترل را به اين نوع يادگيري بيش از پيش جلب كرد. تعميم روش‌هاي يادگيري تقويتي به سيستم‌هاي پيوسته زمان بر خلاف سيستم‌هاي گسسته زمان كاري دشوار مي‌باشد. امروزه استفاده از بازوهاي انعطاف پذير، در صنايع مختلفي از جمله پزشكي، هوافضا و ... رو به افزايش بوده و دانش چگونگي پاسخ به مسائل ايجاد شده در اين حوزه نيز بسيار ضروري مي‌باشد. بازوي انعطاف پذير در حقيقت يك بازوي رباتيكي بوده كه داراي طول بسيار زياد و قطر كم است. چنين بازويي نسبت به بازوي داراي ساختار صلب، داراي مسائل پيچيده تري در حوزه كنترل خود مي‌باشد. كنترل ارتعاشات ايجاد شده در هنگام فعاليت اين ساختار‌ها از جمله چالش‌هاي قابل بحث و مهم در حوزه كنترل اين سيستم‌ها مي‌باشد. در اين پايان‌نامه، يك روش تطبيقي بهينه مقيد به كمك روش يادگيري تقويتي جهت كنترل آنلاين سيستم‌هاي غيرخطي زمان‌ پيوسته با معادلات اَفاين و ديناميك نيمه معلوم ارائه مي‌گردد. سيگنال كنترلي به دست آمده در انتهاي فرآيند يادگيري به مقدار بهينه خود همگرا مي‌شود و دامنه آن از حد اشباع تعريف شده در مساله فراتر نمي‌رود. در گام بعدي اين كنترل‌كننده جهت كنترل آنلاين و كاهش ارتعاشات لينك انعطاف‌پذير مورد استفاده قرار مي‌گيرد و نتايج به دست آمده درستي و موثر بودن روش ارائه شده را تاييد مي‌كنند.
  • تاريخ ورود اطلاعات
    1400/01/21
  • عنوان به انگليسي
    كنترل و كاهش ارتعاشات بازوي انعطافپذير بر اساس روش يادگيري تقويتي
  • تاريخ بهره برداري
    1/1/1900 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    سيدامير قلري

  • چكيده به لاتين
    Reinforcement learning as a sub-branch of machine learning science, is a new method in the field of artificial intelligence and computer. Inspired by how creatures learn in nature and how they interact with their environment, this method offers a variety of algorithms. Over time, reinforcement learning with the introduction of online optimization algorithms has attracted the attention of control engineering researchers to this type of learning more than ever. Unlike discrete time systems, it is difficult to generalize reinforcement learning methods to continuous time systems. Today, the use of flexible manipulators is increasing in various industries such as medicine, aerospace, etc., and knowledge of how to respond to the problems created in this area is also very essential. The flexible manipulator is actually a robotic arm that is very long and small in diameter. Such a flexible link has more complex problems in its area of control than a link with a rigid structure. Controlling vibrations generated during the operation of these structures is one of the most debatable and important challenges in the field of control systems. In this thesis, an online constrained optimal adaptive control method based on the reinforcement learning for partially-unknown nonlinear continuous-time systems with affine equations is presented. The control signal converges to its optimal value at the end of the learning process and its amplitude does not exceed the saturation limit defined in the problem. Next this controller has been used for online control and vibration suppression of a flexible link, and the results confirm the accuracy and effectiveness of the proposed method.
  • كليدواژه هاي فارسي
    يادگيري تقويتي , كنترل تطبيقي بهينه مقيد , بازوي انعطاف‌پذير , سيستم پيوسته زمان
  • كليدواژه هاي لاتين
    Reinforcement learning , constrained optimal adaptive control , flexible link , continuous-time system