• شماره ركورد
    33975
  • پديد آورنده

    محسن ميوند

  • عنوان
    بهينه سازي مصرف سوخت و زمان توقف در ماشين هاي خودران با استفاده از يادگيري تقويتي
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر گرايش نرم افزار
  • سال تحصيل
    1402
  • تاريخ دفاع
    1404/7/13
  • استاد راهنما
    سيد حميد حاجي سيد جوادي
  • استاد مشاور
    فاقد استاد مشاور
  • دانشكده
    واحد نور
  • چكيده
    با توسعه سريع فناوري خودروهاي خودران، بهينه‌سازي مصرف سوخت و كاهش زمان توقف در تقاطع‌هاي داراي چراغ راهنمايي به يكي از چالش‌هاي اصلي در حوزه حمل‌ونقل هوشمند تبديل شده است. اين پژوهش مدلي مبتني بر يادگيري تقويتي با استفاده از الگوريتم بهينه‌سازي سياست تقريبي (PPO)[1] در شبيه‌ساز CARLA[2] ارائه مي‌دهد كه هدف آن بهينه‌سازي رفتار خودروهاي خودران در تقاطع‌هاي شهري است. عامل يادگيري تقويتي با دريافت اطلاعات محيطي نظير وضعيت چراغ راهنمايي، سرعت خودرو، فاصله تا تقاطع و تراكم ترافيك، سرعت و شتاب خودرو را به‌صورت پويا تنظيم مي‌كند تا مصرف سوخت و زمان توقف به حداقل برسد. نتايج حاصل از شبيه‌سازي نشان مي‌دهد كه مدل پيشنهادي در مقايسه با روش‌هاي سنتي (سرعت‌هاي ثابت)، مصرف سوخت را تا 35 درصد و زمان توقف را تا 68 درصد كاهش مي‌دهد، در حالي كه زمان كل سفر را تا 29 درصد بهبود مي‌بخشد. اين مدل از يك تابع پاداش تركيبي بهره مي‌برد كه شامل معيارهاي مصرف سوخت، زمان توقف و پايداري سرعت است و قابليت مقياس‌پذيري در محيط‌هاي پيچيده شهري را دارد. معماري شبكه عصبي عميق مورد استفاده در اين مدل، پايداري و دقت بالايي را در تصميم‌گيري فراهم مي‌كند. اين پژوهش گامي در جهت بهبود كارايي خودروهاي خودران و كاهش اثرات زيست‌محيطي ناشي از مصرف سوخت است. واژه‌هاي كليدي: يادگيري تقويتي، بهينه‌سازي مصرف سوخت، خودروهاي خودران، شبيه‌ساز CARLA، الگوريتم PPO [1] "Proximal Policy Optimization: الگوريتم بهينه‌سازي سياست تقريبي، يك روش مبتني بر سياست براي يادگيري تقويتي كه پايداري بالايي در محيط‌هاي پيچيده فراهم مي‌كند. [2] "Car Learning to Act :CARLA ، شبيه ساز متن براي توسعه الگوريتم هاي رانندگي خودران با پشتيباني سنسورهاي واقعي."
  • تاريخ ورود اطلاعات
    1404/07/29
  • عنوان به انگليسي
    Optimization of Fuel Consumption an‎d Stop Time in Autonomous Vehicles Using Reinforcement Learning (RL)
  • تاريخ بهره برداري
    10/22/2025 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    محسن ميوند

  • چكيده به لاتين
    With the rapid development of autonomous vehicle technology, optimizing fuel consumption an‎d reducing stop times at signalized intersections has emerged as a key challenge in intelligent tra ortation systems. This research proposes a reinforcement learning model based on the Proximal Policy Optimization (PPO) algorithm implemented in the CARLA simulator, aimed at enhancing autonomous vehicle behavior in urban intersections. The RL agent dynamically adjusts vehicle speed an‎d acceleration using environmental inputs such as traffic light status, vehicle speed, distance to the intersection, an‎d traffic density, to minimize fuel consumption an‎d stop times. Simulation results indicate that the proposed model reduces fuel consumption by up to 35% an‎d stop times by up to 68% compared to traditional methods (fixed-speed baselines), while improving total travel time by up to 29%. The model utilizes a composite reward function that integrates fuel efficiency, stop time, an‎d speed stability metrics, demonstrating scalability in complex urban environments. The deep neural network architecture provides high stability an‎d precision in decision-making. This study advances the efficiency of autonomous vehicles an‎d reduces environmental impacts associated with fuel usage. Keywords: Reinforcement Learning, Fuel Consumption Optimization, Autonomous Vehicles, CARLA Simulator, PPO Algorithm
  • كليدواژه هاي فارسي
    : يادگيري تقويتي، بهينه‌سازي مصرف سوخت، خودروهاي خودران، شبيه‌ساز CARLA، الگوريتم PPO
  • كليدواژه هاي لاتين
    Reinforcement learning , fuel consumption , self-driving cars , PPO algorithm
  • Author
    Mohsen Meyvand
  • SuperVisor
    Seyyed Hamid Haji Seyyed Javadi