شماره ركورد
34653
پديد آورنده
محمد مهدي رسولي بيرامي
عنوان
اشتراك طيف بين سيستم هاي راداري و مخابراتي با استفاده از يادگيري تقويتي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق - مخابرات ميدان
سال تحصيل
1401
تاريخ دفاع
1404/7/30
استاد راهنما
محمد سليماني
استاد مشاور
محمد جواد حاجي احمدي
دانشكده
مهندسي برق
چكيده
در اين پژوهش، مسئله همزيستي رادار چندزيرباندي بازپيكربنديپذير با سامانه مخابراتي در سناريوهاي اشتراك طيف بررسي شده است. هدف، كاهش همپوشاني طيفي با كاربران همپهنه در عين حفظ كيفيت حسگري رادار است. روش پيشنهادي بر پايه يادگيري تقويتي با رويكرد Actor–Critic نرم (SAC) طراحي شده است. حالت سامانه از خلاصه نقشه زمان–فركانس و شاخصهاي عملكردي تشكيل ميشود و كنشها، انتخاب پيوسته پهنا و موقعيت زيرباندها را در هر CPI تعيين ميكنند. شكلدهي كنشها بهگونهاي انجام شده كه بازههاي فركانسي همواره معتبر و در محدوده مجاز باشند؛ هموارسازي زماني و حاكم پهنا نيز براي پايداري تصميمها و مهار پرشهاي فركانسي بهكار رفته است. تابع پاداش چندهدفه، همزمان ، «پاكي طيفي»، «بهرهبرداري از باند آزاد» و «پايداري تصميم» را تراز ميكند. نتايج محوري نشان ميدهد سياست آموختهشده بهطور پايدار همپوشاني طيفي را كاهش ميدهد و همزمان بهرهبرداري از باند آزاد و شاخص كيفيت حسگري را در سطح مطلوب نگه ميدارد. . در مجموع، چارچوب ارائهشده مسير عمليِ يادگيري سياستهاي پيوسته را براي رادار شناختي در اشتراك طيف فراهم ميكند و قابليت تعميم آن در سناريوهاي ناديده تأييد شده است.
تاريخ ورود اطلاعات
1405/01/23
عنوان به انگليسي
Spectrum sharing between radar and communication system using reinforcement learining
تاريخ بهره برداري
3/21/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
محمدمهدي رسولي بيرامي
چكيده به لاتين
Spectrum sharing in contested bands challenges radar operation due to time-varying communications occupancy and intentional jamming. This paper presents a jam-aware cognitive radar framework that allocates disjoint subbands and bandwidth on the fly using a Twin Soft Actor-Critic (Twin SAC) agent. The environment provides compact power-spectral-density observations, while the policy emits an interval-structured action that guarantees feasible start–end pairs and smooth bandwidth control. A tailored reward balances radar signal-to-interference-plus-noise considerations with penalties on spectral overlap to both incumbent users and jammers, and includes a guard-band margin and a predictive term to discourage tracking sweeping jammers. Training employs a lightweight curriculum together with a bandwidth governor/floor, a ramp limiter for bandwidth changes, and an exploit-lock mechanism to consolidate strong policies. The framework is compatible with multi-carrier LFM synthesis and is implemented in a single-process setup without distributed workers. We detail the environment formulation, reward shaping, policy parameterization, and training strategy, and discuss how these design choices promote feasibility, stability, and practical deployability for spectrum-sharing radar.
كليدواژه هاي فارسي
اشتراك طيف , يادگيري تقويتي
كليدواژه هاي لاتين
spectrum sharing , reinforcement learning
Author
mohammadmahdi rasouli beirami
SuperVisor
mohammad soleymani