• شماره ركورد
    31833
  • پديد آورنده

    اميرحسين جراره

  • عنوان
    طراحي سامانه مديريت تصميم‌گيري و تخصيص منابع هوشمند در سيستم‌هاي چندعامله رباتيك
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    برق - كنترل
  • سال تحصيل
    1400
  • تاريخ دفاع
    1403/06/25
  • استاد راهنما
    دكتر سعيد شمقدري
  • استاد مشاور
    دكتر سامان عرفا
  • دانشكده
    برق
  • چكيده
    با گسترش سيستم‌هاي رباتيك، مديريت تصميم‌گيري و تخصيص منابع هوشمند، لازم . و ضروري است. اين موضوع، در سيستم‌هاي چندعامله، به دليل افزايش تعداد عامل‌ها، از اهميت بيشتري برخوردار است. يكي از چالش‌هاي اساسي اين حوزه، حل بلادرنگ مسئله بهينه‌سازي چندهدفه مقيد است. در اين راستا، دو تيم با عنوان دوست و دشمن در نظر گرفته شده است. عوامل در تيم دوست و دشمن، به ترتيب عامل و هدف ناميده مي‌شوند. قيود مسئله، شامل محدوده عمليات، شبكه دارايي‌ها، زمان برخاست هر عامل، بيشترين سرعت هر عامل و تعداد عوامل در نظر گرفته شده است. محدوده عمليات محدوده فعاليت تيم دوست مي باشد و شبكه دارايي‌ها، نواحي مهم در محدوده عمليات است. هدف از اين پايان‌نامه تخصيص بهينه عوامل تيم دوست، به اهداف مهم تيم دشمن مي باشد. براي حل مسئله، باتوجه‌به تعداد محدود عوامل براي تخصيص، ابتدا رفتار احتمالي آينده اهداف را ارزيابي مي‌نماييم. اين ارزيابي متناسب با نزديكي به محدوده عمليات و شبكه دارايي‌ها است. رفتار حركتي آينده اهداف، با رويكرد تركيبي يادگيري تقويتي و يادگيري گروهي تعيين و اهداف متناسب با اهميتشان مرتب مي شوند. پس از مرتب‌كردن و انتخاب مهم‌ترين اهداف، با حل مسئله بهينه‌سازي مقيد، اقدام به تخصيص عوامل به اهداف، با كمينه‌سازي زمان مي‌كنيم. زمان حل مسئله بهينه‌سازي، باتوجه‌به تعداد متغير عوامل و اهداف زياد است و نمي‌توان از آن به‌صورت بلادرنگ بهره برد. براي حل مسئله به‌صورت بلادرنگ، با استفاده از روش يادگيري گروهي، اقدام به تقريب و حل مسئله بهينه‌سازي مي‌نماييم. با در نظر گرفتن عوامل و اهداف به‌صورت عامل‌ چند پره به‌عنوان ربات نمونه و تعيين محدوده عمليات و شبكه دارايي‌ها به‌صورت تصادفي، اقدام به توليد مجموعه‌داده مصنوعي مي‌نماييم. با تركيب داده‌هاي مصنوعي با داده‌هاي واقعي، “سامانه تصميم‌گير” را آموزش مي‌دهيم. براي افزايش دقت مدل، با استفاده از الگوريتم ژنتيك ابر پارامترهاي مدل را تعيين مي‌كنيم. در پايان براي حل مسئله به‌صورت بلادرنگ ابتدا با استفاده از تابع تعيين اولويت، اهداف مهم را تعيين مي‌نماييم. سپس با استفاده از سامانه تصميم‌گير، اقدام به تخصيص عوامل به اهداف مي‌كنيم. براي ارزيابي سامانه تصميم‌گير و تابع تعيين اولويت، با استفاده از، داده‌هاي ارزيابي شبيه‌سازي و تست عملي كه در فرايند آموزش دخيل نبوده اند، سامانه تصميم‌گير را ارزيابي مي‌كنيم.
  • تاريخ ورود اطلاعات
    1403/10/16
  • عنوان به انگليسي
    Designing an intelligent decision-making and resource allocation management system in multi-agent robotic systems
  • تاريخ بهره برداري
    1/14/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    اميرحسين جراره

  • چكيده به لاتين
    With the expansion of robotic systems, intelligent decision-making and resource allocation management have become necessary and essential. This issue is of greater significance in multi-agent systems due to the increased number of agents. One of the fundamental challenges in this area is the real-time solution of constrained multi-objective optimization problems. In this context, two teams are considered: the friendly team and the adversarial team. Agents in the friendly and adversarial teams are referred to as agents and targets, respectively. The constraints of the problem include operational range, asset network, agents' takeoff times, maximum speeds of each agent, and the number of agents considered. The operational range is the area of activity of the friendly team, while the asset network highlights important areas within this operational range. The objective of this thesis is the optimal allocation of agents from the friendly team to the important targets of the adversarial team. To solve the problem, given the limited number of agents for allocation, we first eva‎luate the prospective future behavior of the targets. This assessment is based on the proximity to both the operational range and the asset network. The future movement behavior of the targets is determined using a combined approach of reinforcement learning and collective learning, and the targets are prioritized based on their importance. After prioritizing and selecting the most important targets, we allocate agents to these targets by solving the constrained optimization problem while minimizing time. The time required to solve the optimization problem is significant due to the large number of variables for agents and targets, and thus it cannot be effectively used in real-time. To address the problem in real-time, we use collective learning methods to approximate and solve the optimization problem. By treating agents and targets as multi-rotor agents and randomly assigning operational ranges and asset networks, we generate artificial datasets. By combining artificial data with real data, we train the “decision-making system.” To enhance the model's accuracy, we determine the model's hyperparameters using a genetic algorithm. Finally, to solve the problem in real-time, we first identify important targets using a prioritization function. Then, we use the decision-making system to allocate agents to these targets. To eva‎luate the decision-making system and the prioritization function, we assess the decision-making system using simulation eva‎luation data and practical test data that were not involved in the training process.
  • كليدواژه هاي فارسي
    سيستم‌هاي چندعامله , تخصيص وظيفه , مديريت تصميم‌گيري
  • كليدواژه هاي لاتين
    Multi-agent system , Resource allocation , decision-making
  • Author
    Amirhossein Jarareh
  • SuperVisor
    Saeed Shamaghdari