-
شماره ركورد
25734
-
پديد آورنده
فرديس نديمي
-
عنوان
بهينه سازي نرخ مجموع در دسترسي چندگانه ي نامتعامد با يادگيري ماشين
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق مخابرات سيستم
-
سال تحصيل
1397
-
تاريخ دفاع
1400/8/25
-
استاد راهنما
دكتر ابوالفضل فلاحتي
-
دانشكده
مهندسي برق
-
چكيده
تكنيك دسترسي چندگانه نامتعامد (NOMA)، با وجود تمام برتريهايي كه نسبت به روشهاي دسترسي چندگانه متعامد (OMA) دارا ميباشد، روشهاي راهاندازي و بهينهسازي به مراتب پيچيدهتري را اقتضاء ميكند؛ چرا كه بررسي توأم دو مسئلهي اساسي در دسترسي چندگانه نامتعامد، يعني تخصيص توان و جفتسازي كاربر ها، به يك مسئلهي NP-hard منجر خواهد شد. در اين پايان نامه، به راهاندازي و بهينهسازي نرخ مجموع سيستم NOMA با استفاده از يادگيري ماشين و يادگيري تقويتي عميق پرداخته شده است. الگوريتمهاي يادگيري تقويتي عميق براي اين مسئله مورد بررسي قرار گرفته و در نهايت الگوريتم مناسب يعني DDPG پيشنهاد گرديده است. الگوي مناسب براي بررسي توأم مسئلههاي جفتسازي بهينه، به عنوان يك كنش گسسته، و تخصيص توان بهينه براي آن جفت، به عنوان يك كنش پيوسته، بررسي شده و در نهايت فضاي كنش پارامتر شدهي سلسله مراتبي پيشنهاد شده است و همچنين مدلسازي مناسب مسئله براي تطبيق با الگوريتم و الگوي پيشنهادي و عدم انحراف مسئله به مسائل فرعي ارائه شده است. جهت رعايت عدالت در بين كاربرها و عدم انحراف مسئله به سمت جوابهاي بديهي، آستانهي كمترين نرخ مجاز براي كاربران تعريف شده و به الگوريتم اضافه گرديده است. تابع جايزهي مورد نظر براي مسئله به گونهاي مهندسي شده است كه اين تابع مشتق پذير و متقارن به دست آيد. مسئله با وروديهاي پيوسته براي شرايط كانال كاربرها بررسي شده است و نشان داده شده كه الگوريتم يادگيري تقويتي عميق پيشنهادي، نرخ مجموع بهينه را ارائه ميدهد.
-
تاريخ ورود اطلاعات
1400/09/29
-
عنوان به انگليسي
Sum rate optimization for Non-Orthogonal Multiple Access (NOMA) with machine learning
-
تاريخ بهره برداري
11/16/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
فرديس نديمي
-
چكيده به لاتين
Non-orthogonal multiple access (NOMA) is proved to be a groundbreaking technique to meet the required spectral efficiency and massive connectivity expectations of future wireless communication systems. Powered by superposition coding and successive interference cancellation (SIC), NOMA enables multiplexing several users’ data on a single channel. Yet, despite the NOMA principle simplicity, the inherent complexity to fulfill the optimal resource allocation has been a serious drawback. The existing studies on the power allocation and channel assignment over NOMA systems with reinforcement learning algorithms reveal that none of the previous approaches jointly tackled these two problems in a single framework. In this thesis, we propose a deep reinforcement learning framework to jointly address the channel assignment and power allocation problems and achieve the optimal NOMA data sum rate. Specifically, in this framework, we exploit two Deep Deterministic Policy Gradient (DDPG) algorithms extended into a parameterized action space with a hierarchical architecture to accurately consider the formation of the problem and learn the discrete actions and continuous parameters concurrently. Simulation results indicate that the proposed framework can achieve the optimal system performance in comparison with the exhaustive search.
-
كليدواژه هاي فارسي
يادگيري تقويتي عميق , دسترسي چندگانه ي نامتعامد , ظرفيت كانال , نرخ بهينه
-
كليدواژه هاي لاتين
Deep Reinforcement Learning , non-orthogonal multiple access , channel capacity , optimal rate
-
لينک به اين مدرک :