شماره ركورد

12758

عنوان

بررسي استفاده از يادگيري تقويتي عميق در ايجاد هماهنگي در سيستم‌هاي چندعاملي

سال تحصيل

1400

استاد راهنما

دكتر ناصر مزيني

چکيده

با پيشرفت دامنه‌ي كاربردي هوش‌ مصنوعي در دنيا، الگوريتم‌ها و روش‌هاي متنوعي براي بهبود و تقويت اين فناوري ارائه شده است. استفاده از اين روش‌ها در موارد مختلف مانند صنعت، تجارت، آموزش، حمل و نقل و خودروهاي خودران، چالش‌هاي مختلفي را در پي دارد. توسعه‌ي اين الگوريتم‌ها و تركيب آن‌ها با ديگر روش‌ها مي‌تواند به عنوان راهكاري براي حل چالش‌ها درنظر گرفته شود. يادگيري تقويتي به عنوان روشي كه در آن عامل با استفاده از تجربه‌هاي به‌دست‌آمده در طول زمان بهترين راه را براي رسيدن به هدف مي‌يابد، يكي از روش‌هاي جديد مورد استفاده در هوش مصنوعي است. يادگيري تقويتي عميق، با تركيب يادگيري عميق و يادگيري تقويتي براي بهبود كارايي و دقت در حل مسائل ارائه‌ شده است. با توجه به ماهيت متنوع محيط‌هاي كاربردي و نوع مسئله‌ي مطرح شده، تعداد عوامل در اين محيط‌ها مي‌تواند از يك تا چند عامل گسترش پيدا كند. محيط‌هاي تك‌عاملي از يك عامل تشكيل مي‌شوند كه مي‌تواند با استفاده از يادگيري تقويتي و يادگيري تقويتي عميق كنشي براي دستيابي به هدف، در محيط انجام دهد. محيط‌هاي چندعاملي شامل تعداد بيشتري از عامل‌هاست كه با همكاري و هماهنگي با يك‌ديگر براي رسيدن به بهترين هدف تلاش مي‌كنند. استفاده از يادگيري تقويتي عميق در محيط‌هاي چندعاملي براي افزايش كارايي و كاهش خطا در عين حفظ عملكرد مي‌تواند به افزايش سودمندي و پاسخ به اين چالش‌ها كمك كند. هماهنگي در سيستم‌هاي چندعاملي يك كار چالش‌برانگيز است كه در سال‌هاي اخير به طور گسترده مورد مطالعه قرار گرفته ‌است. يكي از رويكردهاي نوين براي دستيابي به هماهنگي مؤثر، استفاده از يادگيري تقويتي عميق است كه نتايج اميدواركننده‌اي را در كاربردهاي مختلف نشان داده است. هدف ما در اين سمينار، بررسي استفاده از يادگيري تقويتي عميق به منظور ايجاد هماهنگي در سيستم‌هاي چندعاملي است. از اين‌‌رودر ابتدا مفاهيم و تعاريف مرتبط با اين موضوع تشريح مي‌شود و در ادامه به بررسي كارهاي مرتبط در حوزه‌ي استفاده از يادگيري تقويتي عميق در سيستم‌هاي چندعاملي پرداخته خواهد شد. كارهاي مرتبط در اين حوزه براساس ويژگي‌هاي مشتركي كه داشتند دسته بندي و جدول مقايسه‌اي بين كارهاي انجام شده تهيه گرديده است. در آخر با بررسي جدول و كارهاي مطالعه شده و كشف چالش‌هاي موجود در اين حوزه، پيشنهاد پايان نامه در جهت مرتفع كردن چالش‌هاي اين حوزه ارائه خواهد شد.

نام دانشجو

فائزه صادقي

تاريخ ارائه

11/15/2023 12:00:00 AM

متن كامل

81055

پديد آورنده

فائزه صادقي

تاريخ ورود اطلاعات

1402/09/08

عنوان به انگليسي

Investigating the use of deep reinforcement learning in creating coordination in multi-agent systems

كليدواژه هاي فارسي

سيستم‌هاي چند‌عاملي , يادگيري تقويتي عميق , هماهنگي

كليدواژه هاي لاتين

Multi Agent Systems , Deep Reinforcement Learning , Coordination

لينک به اين مدرک :

http://dl.iust.ac.ir/dL/search/default.aspx?Term=12758&Field=0&DTC=14