شماره ركورد

7088

عنوان

كنترل بهينه با استفاده از يادگيري تقويتي

سال تحصيل

1398

استاد راهنما

دكتر پشتان

چکيده

چكيده يادگيري تقويتي (Learning Reinforcement (در حال حاضر يكي از موضوعات داغ پژوهشمي محسموب ميشود و محبوبيت آن روز به روز در حال افزايش است. در ايپ مطلب پمن موضموعي كمه عالقمنمدان و فعاالن ايپ حوزه بايد در رابطه با آن بدانند تشريح ميشود.از آنجا كه يادگيري تقويتي نيازمند حجم زيمادي از دادهها است، بنابرايپ بيشتر در دامنههايي مانند رباتيك كاربرد دارد كه در آنها دادههاي شبيهسازي شمده به صورت آماده موجود هستند.در رباتيك و خودكارسازي صنعتي، يادگيري تقويتي براي قادرسازي رباتها به ساخت سيستمهاي تطبيقي موثر براي خودشان كه از تجربيات و رفتارهاي خود ميآموزند مورد اسمتفاده قرار ميگيرد. پژوهشهاي ديپ مايند (DeepMind (در زمينه يادگيري عميب تقويتي براي كنترل رباتيكي بما استفاده از بازوهاي مكانيكي (Manipulation Robotic (با سياست نامتقارن مثال خوبي از ايپ مورد است. واژههاي كليدي: يادگيري تقويتي ، كنترل بهينه ، يادگيري Q

نام دانشجو

عليرضا زارع خورميزي

Name: عليرضا زارع خورميزي
Author: عليرضا زارع خورميزي

تاريخ ارائه

11/20/2019 12:00:00 AM

متن كامل

67419

پديد آورنده

عليرضا زارع خورميزي

تاريخ ورود اطلاعات

1398/12/17

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=7088&Field=0&DTC=14