شماره ركورد
31833
پديد آورنده
اميرحسين جراره
عنوان
طراحي سامانه مديريت تصميمگيري و تخصيص منابع هوشمند در سيستمهاي چندعامله رباتيك
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
برق - كنترل
سال تحصيل
1400
تاريخ دفاع
1403/06/25
استاد راهنما
دكتر سعيد شمقدري
استاد مشاور
دكتر سامان عرفا
دانشكده
برق
چكيده
با گسترش سيستمهاي رباتيك، مديريت تصميمگيري و تخصيص منابع هوشمند، لازم . و ضروري است. اين موضوع، در سيستمهاي چندعامله، به دليل افزايش تعداد عاملها، از اهميت بيشتري برخوردار است. يكي از چالشهاي اساسي اين حوزه، حل بلادرنگ مسئله بهينهسازي چندهدفه مقيد است. در اين راستا، دو تيم با عنوان دوست و دشمن در نظر گرفته شده است. عوامل در تيم دوست و دشمن، به ترتيب عامل و هدف ناميده ميشوند. قيود مسئله، شامل محدوده عمليات، شبكه داراييها، زمان برخاست هر عامل، بيشترين سرعت هر عامل و تعداد عوامل در نظر گرفته شده است. محدوده عمليات محدوده فعاليت تيم دوست مي باشد و شبكه داراييها، نواحي مهم در محدوده عمليات است. هدف از اين پاياننامه تخصيص بهينه عوامل تيم دوست، به اهداف مهم تيم دشمن مي باشد. براي حل مسئله، باتوجهبه تعداد محدود عوامل براي تخصيص، ابتدا رفتار احتمالي آينده اهداف را ارزيابي مينماييم. اين ارزيابي متناسب با نزديكي به محدوده عمليات و شبكه داراييها است. رفتار حركتي آينده اهداف، با رويكرد تركيبي يادگيري تقويتي و يادگيري گروهي تعيين و اهداف متناسب با اهميتشان مرتب مي شوند. پس از مرتبكردن و انتخاب مهمترين اهداف، با حل مسئله بهينهسازي مقيد، اقدام به تخصيص عوامل به اهداف، با كمينهسازي زمان ميكنيم. زمان حل مسئله بهينهسازي، باتوجهبه تعداد متغير عوامل و اهداف زياد است و نميتوان از آن بهصورت بلادرنگ بهره برد. براي حل مسئله بهصورت بلادرنگ، با استفاده از روش يادگيري گروهي، اقدام به تقريب و حل مسئله بهينهسازي مينماييم. با در نظر گرفتن عوامل و اهداف بهصورت عامل چند پره بهعنوان ربات نمونه و تعيين محدوده عمليات و شبكه داراييها بهصورت تصادفي، اقدام به توليد مجموعهداده مصنوعي مينماييم. با تركيب دادههاي مصنوعي با دادههاي واقعي، “سامانه تصميمگير” را آموزش ميدهيم. براي افزايش دقت مدل، با استفاده از الگوريتم ژنتيك ابر پارامترهاي مدل را تعيين ميكنيم. در پايان براي حل مسئله بهصورت بلادرنگ ابتدا با استفاده از تابع تعيين اولويت، اهداف مهم را تعيين مينماييم. سپس با استفاده از سامانه تصميمگير، اقدام به تخصيص عوامل به اهداف ميكنيم. براي ارزيابي سامانه تصميمگير و تابع تعيين اولويت، با استفاده از، دادههاي ارزيابي شبيهسازي و تست عملي كه در فرايند آموزش دخيل نبوده اند، سامانه تصميمگير را ارزيابي ميكنيم.
تاريخ ورود اطلاعات
1403/10/16
عنوان به انگليسي
Designing an intelligent decision-making and resource allocation management system in multi-agent robotic systems
تاريخ بهره برداري
1/14/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
اميرحسين جراره
چكيده به لاتين
With the expansion of robotic systems, intelligent decision-making and resource allocation management have become necessary and essential. This issue is of greater significance in multi-agent systems due to the increased number of agents. One of the fundamental challenges in this area is the real-time solution of constrained multi-objective optimization problems. In this context, two teams are considered: the friendly team and the adversarial team. Agents in the friendly and adversarial teams are referred to as agents and targets, respectively. The constraints of the problem include operational range, asset network, agents' takeoff times, maximum speeds of each agent, and the number of agents considered. The operational range is the area of activity of the friendly team, while the asset network highlights important areas within this operational range. The objective of this thesis is the optimal allocation of agents from the friendly team to the important targets of the adversarial team. To solve the problem, given the limited number of agents for allocation, we first evaluate the prospective future behavior of the targets. This assessment is based on the proximity to both the operational range and the asset network. The future movement behavior of the targets is determined using a combined approach of reinforcement learning and collective learning, and the targets are prioritized based on their importance. After prioritizing and selecting the most important targets, we allocate agents to these targets by solving the constrained optimization problem while minimizing time. The time required to solve the optimization problem is significant due to the large number of variables for agents and targets, and thus it cannot be effectively used in real-time. To address the problem in real-time, we use collective learning methods to approximate and solve the optimization problem. By treating agents and targets as multi-rotor agents and randomly assigning operational ranges and asset networks, we generate artificial datasets. By combining artificial data with real data, we train the “decision-making system.” To enhance the model's accuracy, we determine the model's hyperparameters using a genetic algorithm. Finally, to solve the problem in real-time, we first identify important targets using a prioritization function. Then, we use the decision-making system to allocate agents to these targets. To evaluate the decision-making system and the prioritization function, we assess the decision-making system using simulation evaluation data and practical test data that were not involved in the training process.
كليدواژه هاي فارسي
سيستمهاي چندعامله , تخصيص وظيفه , مديريت تصميمگيري
كليدواژه هاي لاتين
Multi-agent system , Resource allocation , decision-making
Author
Amirhossein Jarareh
SuperVisor
Saeed Shamaghdari