شماره ركورد
13952
عنوان
بررسي روش هاي بهينه سازي رفتار شخصيت هاي غيرقابل بازي با استفاده از يادگيري تقويتي چندعامله
سال تحصيل
1402
استاد راهنما
دكتر ناصر مزيني
استاد مشاور
دكتر بهروز مينايي بيدگلي
چکيده
در بازيهاي ويدئويي، تعاملات واقعگرايانه و هوشمندانه شخصيتهاي غيرقابلبازي ميتواند تجربه بازيكنان را بهبود بخشيده و بازي را جذابتر كند. با اين حال، ايجاد شخصيتهاي غيرقابلبازياي كه بتوانند به صورت طبيعي و هوشمندانه با بازيكنان و محيط بازي تعامل كنند، يكي از چالشهاي بزرگ در توسعه بازيها ميباشد. يادگيري تقويتي چندعامله به عنوان يكي از رويكردهاي پيشرفته در هوش مصنوعي ميتواند در بهبود رفتار شخصيتهاي غيرقابلبازي نقش مؤثري ايفا كند.
در اين گزارش، به بررسي روشهاي بهينهسازي رفتار شخصيتهاي غيرقابلبازي با استفاده از يادگيري تقويتي چندعامله پرداخته ميشود. هدف اصلي ما تحليل چالشها و فرصتهاي پيش روي هوشمندسازي و بهينهسازي NPCها در بازيهاي ويدئويي با بهرهگيري از الگوريتمهاي مدرن MARL است.
در اين تحقيق، روشهاي مختلفي براي حل اين چالشها مورد بررسي قرار ميگيرند. اين روشها شامل الگوريتمهاي يادگيري تقويتي مانند DQN،PPO، QMIX، و MADDPG هستند كه به طور خاص براي بهبود هماهنگي و همكاري ميان عاملها در محيطهاي چندعامله طراحي شدهاند. علاوه بر اين، به روشهايي براي يادگيري و بهينهسازي سياستهاي رفتاري NPCها پرداخته شده و تاثير اين الگوريتمها بر تعاملات بازي بررسي ميشود.
ابتدا مفاهيم و تعاريف مرتبط با اين موضوع تشريح مي شود و در ادامه به بررسي كارهاي مرتبط در حوزه استفاده از يادگيري تقويتي در سيستم هاي چندعاملي پرداخته خواهد شد. كارهاي مرتبط در اين حوزه براساس ويژگي هاي مشتركي كه داشتند دسته بندي و جدول مقايسه اي بين كارهاي انجام شده تهيه گرديده است. نهايتاً، سمينار با ارائه پيشنهاداتي براي تحقيقات آينده و بررسي چالشهاي باز، مسيرهاي جديدي براي بهبود هوشمندسازي و تعامل NPCها در بازيهاي ويدئويي معرفي ميكند.
نام دانشجو
محمود فاضلي
تاريخ ارائه
1/1/1900 12:00:00 AM
متن كامل
84276
پديد آورنده
محمود فاضلي
تاريخ ورود اطلاعات
1403/07/21
كليدواژه هاي فارسي
يادگيري تقويتي، سيستمهاي چندعامله، هماهنگي