-
شماره ركورد
1204
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
1204
-
پديد آورنده
منيره عبدوس
-
عنوان
ارائه يك مدل يادگيري تقويتي با نظارت چندسطحي در سيستمهاي چندعامله هولوني
-
مقطع تحصيلي
دكتري
-
رشته تحصيلي
كامپيوتر - هوش مصنوعي
-
سال تحصيل
تير ماه 1392
-
تاريخ دفاع
تير ماه 1392
-
استاد راهنما
دكتر ناصر مزيني
-
چكيده
چكيده
سيستمهاي چندعامله روش مناسبي براي مدل¬سازي مسائل توزيع شده فراهم مي آورند. چنانچه يك سيستم چندعامله از تعداد زيادي عامل تشكيل شده باشد، استفاده از روشهاي كلاسيك در سيستمهاي چندعامله كارا نخواهد بود و نياز است همچون جامعه انساني از روشهاي مبتني بر سازمان استفاده شود.
سازمان هولوني به عنوان يكي از سازمانهاي موفق در حوزه سيستمهاي چندعامله، مورد توجه بسياري از محققين قرار گرفته است. بر اساس اصولي كه توسط مبدع مفهوم هولون بيان شده، سازمان هولوني به صورت مجموعه¬اي از سلسله مراتب در هم آميخته داراي ساختار انتزاعي ديده مي¬شود. اين سازمان از موجوديتهاي خودمتشابهي تشكيل شده كه به صورت بازگشتي در يك ساختار سلسله مراتبي قرار گرفتهاند. از جمله ويژگيهاي اين سازمان ميتوان به خودمتشابهي، قابليت اطمينان، مقاوم بودن و پويايي آن اشاره نمود.
قابليت يادگيري يكي از مباحث مهمي است كه در سيستمهاي مبتني بر عامل مطرح ميشود. يكي از متداولترين روشهايي كه عاملها براي يادگيري به كار ميبرند، بر مبناي سعي و خطا است كه تحت عنوان "يادگيري تقويتي" مطرح گرديده است. به دليل اهميت يادگيري تقويتي در محيطهاي ناشناخته و همچنين سازمان هولوني در مدل¬سازي سيستمهاي داراي مقياس بالا، يادگيري تقويتي در سازمان هولوني جايگاه مهمي دارد. عليرغم مطالعات زيادي كه در اين حوزه انجام گرفته، تاكنون مدلي عمومي براي يادگيري تقويتي در اين سازمان ارائه نشده است. هدف از انجام رساله، ارائه مدل يادگيري تقويتي مطابق با ويژگي¬هاي سيستمهاي چندعامله هولوني است كه تا حد امكان عمومي بوده و قابل استفاده در كاربردهاي مختلف باشد. در اين رساله، با در نظر گرفتن عناصر يادگيري تقويتي و اصول سيستمهاي چندعامله هولوني، مدلي جهت يادگيري تقويتي در اين سيستمها ارائه شده است. خودمتشابهي هولونها در سطوح مختلف انتزاع، ارتباط ميان هولونها و مقاوم بودن مدل يادگيري در برابر اختلال در ارتباط از ويژگيهاي مهم مدل ارائه شده است كه به همراه تحليل همگرايي و كارايي در اين رساله به آنها پرداخته شده است.
سيستمهاي چندعامله كاربردهاي مختلفي در جهان واقعي دارد كه از جمله مي¬توان به كنترل ترافيك شهري اشاره كرد. كاهش ميانگين زمان تاخير با استفاده از زمانبندي چراغهاي راهنمايي، يكي از اهدافي است كه در كنترل ترافيك دنبال مي¬شود. با توجه به ويژگيهاي منحصر به فرد سازمان هولوني در مدلسازي سيستمهاي توزيع شده با مقياس بالا و نقش يادگيري تقويتي در محيطهاي پويا، يك شبكه ترافيكي متشكل از تعداد زيادي تقاطع به عنوان بستر مناسبي در اين راستا مورد استفاده قرار گرفته است. نتايج تجربي نشان ميدهند كاربرد مدل پيشنهادي كنترل ترافيك باعث كاهش ميانگين زمان تاخير شده و كنترلي مقاوم و قابل اطمينان در اين حوزه فراهم مي¬آورد.
واژههاي كليدي: يادگيري تقويتي، سيستمهاي چندعامله هولوني، كنترل ترافيك هوشمند.
-
لينک به اين مدرک :