-
شماره ركورد
12758
-
عنوان
بررسي استفاده از يادگيري تقويتي عميق در ايجاد هماهنگي در سيستمهاي چندعاملي
-
سال تحصيل
1400
-
استاد راهنما
دكتر ناصر مزيني
-
چکيده
با پيشرفت دامنهي كاربردي هوش مصنوعي در دنيا، الگوريتمها و روشهاي متنوعي براي بهبود و تقويت اين فناوري ارائه شده است. استفاده از اين روشها در موارد مختلف مانند صنعت، تجارت، آموزش، حمل و نقل و خودروهاي خودران، چالشهاي مختلفي را در پي دارد. توسعهي اين الگوريتمها و تركيب آنها با ديگر روشها ميتواند به عنوان راهكاري براي حل چالشها درنظر گرفته شود.
يادگيري تقويتي به عنوان روشي كه در آن عامل با استفاده از تجربههاي بهدستآمده در طول زمان بهترين راه را براي رسيدن به هدف مييابد، يكي از روشهاي جديد مورد استفاده در هوش مصنوعي است. يادگيري تقويتي عميق، با تركيب يادگيري عميق و يادگيري تقويتي براي بهبود كارايي و دقت در حل مسائل ارائه شده است. با توجه به ماهيت متنوع محيطهاي كاربردي و نوع مسئلهي مطرح شده، تعداد عوامل در اين محيطها ميتواند از يك تا چند عامل گسترش پيدا كند. محيطهاي تكعاملي از يك عامل تشكيل ميشوند كه ميتواند با استفاده از يادگيري تقويتي و يادگيري تقويتي عميق كنشي براي دستيابي به هدف، در محيط انجام دهد. محيطهاي چندعاملي شامل تعداد بيشتري از عاملهاست كه با همكاري و هماهنگي با يكديگر براي رسيدن به بهترين هدف تلاش ميكنند. استفاده از يادگيري تقويتي عميق در محيطهاي چندعاملي براي افزايش كارايي و كاهش خطا در عين حفظ عملكرد ميتواند به افزايش سودمندي و پاسخ به اين چالشها كمك كند. هماهنگي در سيستمهاي چندعاملي يك كار چالشبرانگيز است كه در سالهاي اخير به طور گسترده مورد مطالعه قرار گرفته است. يكي از رويكردهاي نوين براي دستيابي به هماهنگي مؤثر، استفاده از يادگيري تقويتي عميق است كه نتايج اميدواركنندهاي را در كاربردهاي مختلف نشان داده است.
هدف ما در اين سمينار، بررسي استفاده از يادگيري تقويتي عميق به منظور ايجاد هماهنگي در سيستمهاي چندعاملي است. از اينرودر ابتدا مفاهيم و تعاريف مرتبط با اين موضوع تشريح ميشود و در ادامه به بررسي كارهاي مرتبط در حوزهي استفاده از يادگيري تقويتي عميق در سيستمهاي چندعاملي پرداخته خواهد شد. كارهاي مرتبط در اين حوزه براساس ويژگيهاي مشتركي كه داشتند دسته بندي و جدول مقايسهاي بين كارهاي انجام شده تهيه گرديده است. در آخر با بررسي جدول و كارهاي مطالعه شده و كشف چالشهاي موجود در اين حوزه، پيشنهاد پايان نامه در جهت مرتفع كردن چالشهاي اين حوزه ارائه خواهد شد.
-
نام دانشجو
فائزه صادقي
-
تاريخ ارائه
11/15/2023 12:00:00 AM
-
متن كامل
81055
-
پديد آورنده
فائزه صادقي
-
تاريخ ورود اطلاعات
1402/09/08
-
عنوان به انگليسي
Investigating the use of deep reinforcement learning in creating coordination in multi-agent systems
-
كليدواژه هاي فارسي
سيستمهاي چندعاملي , يادگيري تقويتي عميق , هماهنگي
-
كليدواژه هاي لاتين
Multi Agent Systems , Deep Reinforcement Learning , Coordination
-
لينک به اين مدرک :