شماره ركورد
33975
پديد آورنده
محسن ميوند
عنوان
بهينه سازي مصرف سوخت و زمان توقف در ماشين هاي خودران با استفاده از يادگيري تقويتي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر گرايش نرم افزار
سال تحصيل
1402
تاريخ دفاع
1404/7/13
استاد راهنما
سيد حميد حاجي سيد جوادي
استاد مشاور
فاقد استاد مشاور
دانشكده
واحد نور
چكيده
با توسعه سريع فناوري خودروهاي خودران، بهينهسازي مصرف سوخت و كاهش
زمان توقف در تقاطعهاي داراي چراغ راهنمايي به يكي از چالشهاي اصلي در حوزه حملونقل
هوشمند تبديل شده است. اين پژوهش مدلي مبتني بر يادگيري تقويتي با استفاده از
الگوريتم بهينهسازي سياست تقريبي (PPO)[1] در شبيهساز CARLA[2] ارائه ميدهد كه هدف آن بهينهسازي
رفتار خودروهاي خودران در تقاطعهاي شهري است. عامل يادگيري تقويتي با دريافت
اطلاعات محيطي نظير وضعيت چراغ راهنمايي، سرعت خودرو، فاصله تا تقاطع و تراكم ترافيك،
سرعت و شتاب خودرو را بهصورت پويا تنظيم ميكند تا مصرف سوخت و زمان توقف به
حداقل برسد. نتايج حاصل از شبيهسازي نشان ميدهد كه مدل پيشنهادي در مقايسه با
روشهاي سنتي (سرعتهاي ثابت)، مصرف سوخت را تا 35 درصد و زمان توقف را تا 68 درصد
كاهش ميدهد، در حالي كه زمان كل سفر را تا 29 درصد بهبود ميبخشد. اين مدل از يك
تابع پاداش تركيبي بهره ميبرد كه شامل معيارهاي مصرف سوخت، زمان توقف و پايداري
سرعت است و قابليت مقياسپذيري در محيطهاي پيچيده شهري را دارد. معماري شبكه عصبي
عميق مورد استفاده در اين مدل، پايداري و دقت بالايي را در تصميمگيري فراهم ميكند.
اين پژوهش گامي در جهت بهبود كارايي خودروهاي خودران و كاهش اثرات زيستمحيطي ناشي
از مصرف سوخت است.
واژههاي
كليدي: يادگيري تقويتي، بهينهسازي مصرف سوخت،
خودروهاي خودران، شبيهساز CARLA، الگوريتم PPO
[1] "Proximal Policy Optimization: الگوريتم بهينهسازي سياست تقريبي، يك روش
مبتني بر سياست براي يادگيري تقويتي كه پايداري بالايي در محيطهاي پيچيده فراهم ميكند.
[2] "Car Learning to
Act :CARLA ، شبيه ساز متن براي توسعه الگوريتم هاي رانندگي خودران با پشتيباني
سنسورهاي واقعي."
تاريخ ورود اطلاعات
1404/07/29
عنوان به انگليسي
Optimization of Fuel Consumption and Stop Time in Autonomous Vehicles Using Reinforcement Learning (RL)
تاريخ بهره برداري
10/22/2025 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محسن ميوند
چكيده به لاتين
With the rapid development of autonomous
vehicle technology, optimizing fuel consumption and reducing stop times at
signalized intersections has emerged as a key challenge in intelligent
tra ortation systems. This research proposes a reinforcement learning model
based on the Proximal Policy Optimization (PPO) algorithm implemented in the
CARLA simulator, aimed at enhancing autonomous vehicle behavior in urban
intersections. The RL agent dynamically adjusts vehicle speed and acceleration
using environmental inputs such as traffic light status, vehicle speed,
distance to the intersection, and traffic density, to minimize fuel consumption
and stop times. Simulation results indicate that the proposed model reduces
fuel consumption by up to 35% and stop times by up to 68% compared to
traditional methods (fixed-speed baselines), while improving total travel time
by up to 29%. The model utilizes a composite reward function that integrates
fuel efficiency, stop time, and speed stability metrics, demonstrating
scalability in complex urban environments. The deep neural network architecture
provides high stability and precision in decision-making. This study advances
the efficiency of autonomous vehicles and reduces environmental impacts
associated with fuel usage.
Keywords: Reinforcement Learning, Fuel
Consumption Optimization, Autonomous Vehicles, CARLA Simulator, PPO Algorithm
كليدواژه هاي فارسي
: يادگيري تقويتي، بهينهسازي مصرف سوخت، خودروهاي خودران، شبيهساز CARLA، الگوريتم PPO
كليدواژه هاي لاتين
Reinforcement learning , fuel consumption , self-driving cars , PPO algorithm
Author
Mohsen Meyvand
SuperVisor
Seyyed Hamid Haji Seyyed Javadi