محمد مهدي رسولي بيرامي

عنوان

اشتراك طيف بين سيستم هاي راداري و مخابراتي با استفاده از يادگيري تقويتي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي برق - مخابرات ميدان

سال تحصيل

1401

تاريخ دفاع

1404/7/30

استاد راهنما

محمد سليماني

استاد مشاور

محمد جواد حاجي احمدي

دانشكده

مهندسي برق

چكيده

در اين پژوهش، مسئله هم‌زيستي رادار چندزير‌باندي بازپيكربندي‌پذير با سامانه مخابراتي در سناريوهاي اشتراك طيف بررسي شده است. هدف، كاهش هم‌پوشاني طيفي با كاربران هم‌پهنه در عين حفظ كيفيت حسگري رادار است. روش پيشنهادي بر پايه يادگيري تقويتي با رويكرد Actor–Critic نرم (SAC) طراحي شده است. حالت سامانه از خلاصه نقشه زمان–فركانس و شاخص‌هاي عملكردي تشكيل مي‌شود و كنش‌ها، انتخاب پيوسته پهنا و موقعيت زير‌باندها را در هر CPI تعيين مي‌كنند. شكل‌دهي كنش‌ها به‌گونه‌اي انجام شده كه بازه‌هاي فركانسي همواره معتبر و در محدوده مجاز باشند؛ هموارسازي زماني و حاكم پهنا نيز براي پايداري تصميم‌ها و مهار پرش‌هاي فركانسي به‌كار رفته است. تابع پاداش چندهدفه، هم‌زمان ، «پاكي طيفي»، «بهره‌برداري از باند آزاد» و «پايداري تصميم» را تراز مي‌كند. نتايج محوري نشان مي‌دهد سياست آموخته‌شده به‌طور پايدار هم‌پوشاني طيفي را كاهش مي‌دهد و هم‌زمان بهره‌برداري از باند آزاد و شاخص كيفيت حسگري را در سطح مطلوب نگه مي‌دارد. . در مجموع، چارچوب ارائه‌شده مسير عمليِ يادگيري سياست‌هاي پيوسته را براي رادار شناختي در اشتراك طيف فراهم مي‌كند و قابليت تعميم آن در سناريوهاي ناديده تأييد شده است.

تاريخ ورود اطلاعات

1405/01/23

عنوان به انگليسي

Spectrum sharing between radar an‎d communication system using reinforcement learining

تاريخ بهره برداري

3/21/2026 12:00:00 AM

دانشجوي وارد كننده اطلاعات

محمدمهدي رسولي بيرامي

Name: محمدمهدي رسولي بيرامي
Author: محمد مهدي رسولي بيرامي

چكيده به لاتين

Spectrum sharing in contested ban‎ds challenges radar operation due to time-varying communications occupancy an‎d intentional jamming. This paper presents a jam-aware cognitive radar framework that allocates disjoint subban‎ds an‎d ban‎dwidth on the fly using a Twin Soft Actor-Critic (Twin SAC) agent. The environment provides compact power-spectral-density observations, while the policy emits an interval-structured action that guarantees feasible start–end pairs an‎d smooth ban‎dwidth control. A tailored reward balances radar signal-to-interference-plus-noise considerations with penalties on spectral overlap to both incumbent users an‎d jammers, an‎d includes a guard-ban‎d margin an‎d a predictive term to discourage tracking sweeping jammers. Training employs a lightweight curriculum together with a ban‎dwidth governor/floor, a ramp limiter for ban‎dwidth changes, an‎d an exploit-lock mechanism to consolidate strong policies. The framework is compatible with multi-carrier LFM synthesis an‎d is implemented in a single-process setup without distributed workers. We detail the environment formulation, reward shaping, policy parameterization, an‎d training strategy, an‎d discuss how these design choices promote feasibility, stability, an‎d practical deployability for spectrum-sharing radar.

كليدواژه هاي فارسي

اشتراك طيف , يادگيري تقويتي

كليدواژه هاي لاتين

spectrum sharing , reinforcement learning

Author

mohammadmahdi rasouli beirami

SuperVisor

mohammad soleymani

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=34653&Field=0&DTC=6