• شماره ركورد
    25734
  • پديد آورنده

    فرديس نديمي

  • عنوان
    بهينه سازي نرخ مجموع در دسترسي چندگانه ي نامتعامد با يادگيري ماشين
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق مخابرات سيستم
  • سال تحصيل
    1397
  • تاريخ دفاع
    1400/8/25
  • استاد راهنما
    دكتر ابوالفضل فلاحتي
  • دانشكده
    مهندسي برق
  • چكيده
    تكنيك دسترسي چندگانه نا‌متعامد (NOMA)، با وجود تمام برتري‌هايي كه نسبت به روش‌هاي دسترسي چندگانه متعامد (OMA) دارا مي‌باشد، روش‌هاي راه‌اندازي و بهينه‌سازي به مراتب پيچيده‌تري را اقتضاء مي‌كند؛ چرا كه بررسي توأم دو مسئله‌ي اساسي در دسترسي چندگانه نامتعامد، يعني تخصيص توان و جفت‌سازي كاربر ها، به يك مسئله‌ي NP-hard منجر خواهد شد. در اين پايان نامه، به راه‌اندازي و بهينه‌سازي نرخ مجموع سيستم NOMA با استفاده از يادگيري ماشين و يادگيري تقويتي عميق پرداخته شده است. الگوريتم‌هاي يادگيري تقويتي عميق براي اين مسئله مورد بررسي قرار گرفته و در نهايت الگوريتم مناسب يعني DDPG پيشنهاد گرديده است. الگوي مناسب براي بررسي توأم مسئله‌هاي جفت‌سازي بهينه، به عنوان يك كنش گسسته، و تخصيص توان بهينه براي آن جفت، به عنوان يك كنش پيوسته، بررسي شده و در نهايت فضاي كنش پارامتر شده‌ي سلسله مراتبي پيشنهاد شده است و همچنين مدل‌سازي مناسب مسئله براي تطبيق با الگوريتم و الگوي پيشنهادي و عدم انحراف مسئله به مسائل فرعي ارائه شده است. جهت رعايت عدالت در بين كاربر‌ها و عدم انحراف مسئله به سمت جواب‌هاي بديهي، آستانه‌ي كمترين نرخ مجاز براي كاربران تعريف شده و به الگوريتم اضافه گرديده است. تابع جايزه‌ي مورد نظر براي مسئله به گونه‌اي مهندسي شده است كه اين تابع مشتق پذير و متقارن به دست آيد. مسئله با ورودي‌هاي پيوسته براي شرايط كانال كاربر‌ها بررسي شده است و نشان داده شده كه الگوريتم يادگيري تقويتي عميق پيشنهادي، نرخ مجموع بهينه را ارائه مي‌دهد.
  • تاريخ ورود اطلاعات
    1400/09/29
  • عنوان به انگليسي
    Sum rate optimization for Non-Orthogonal Multiple Access (NOMA) with machine learning
  • تاريخ بهره برداري
    11/16/2022 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    فرديس نديمي

  • چكيده به لاتين
    Non-orthogonal multiple access (NOMA) is proved to be a groundbreaking technique to meet the required spectral efficiency and massive connectivity expectations of future wireless communication systems. Powered by superposition coding and successive interference cancellation (SIC), NOMA enables multiplexing several users’ data on a single channel. Yet, despite the NOMA principle simplicity, the inherent complexity to fulfill the optimal resource allocation has been a serious drawback. The existing studies on the power allocation and channel assignment over NOMA systems with reinforcement learning algorithms reveal that none of the previous approaches jointly tackled these two problems in a single framework. In this thesis, we propose a deep reinforcement learning framework to jointly address the channel assignment and power allocation problems and achieve the optimal NOMA data sum rate. Specifically, in this framework, we exploit two Deep Deterministic Policy Gradient (DDPG) algorithms extended into a parameterized action space with a hierarchical architecture to accurately consider the formation of the problem and learn the discrete actions and continuous parameters concurrently. Simulation results indicate that the proposed framework can achieve the optimal system performance in comparison with the exhaustive search.
  • كليدواژه هاي فارسي
    يادگيري تقويتي عميق , دسترسي چندگانه ي نامتعامد , ظرفيت كانال , نرخ بهينه
  • كليدواژه هاي لاتين
    Deep Reinforcement Learning , non-orthogonal multiple access , channel capacity , optimal rate