فرنوش نامجونيا

عنوان

كُدگذاريِ تطبيق ذيرِ منبع براي ارسالِ مقيّد به تأخيرِ داده ها توسط تجهيزات حسگري اينترنت اشياء با قابليت برداشتِ انرژي

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

شبكه‌هاي كامپيوتري

سال تحصيل

98-99

تاريخ دفاع

1399/3/13

استاد راهنما

دكتر وصال حكمي

دانشكده

كامپيوتر

چكيده

يكي از مهم ترين چالش هاي توسعه اينترنت اشياء، محدوديت انرژي تجهيزات است. براي صرفه جويي در مصرف انرژي تجهيزات اينترنت اشياء مي توان از تكنيك هاي كاهش حجم داده براي انتقال (مثلا از طريق فشرده سازي داده هاي دريافتي از حسگرها كه در دو نوع فشرده سازي با اتلاف و بدون اتلاف صورت مي پذيرد) و همچنين از پيشرفت هاي فناوري (مثل برداشت انرژي) بهره برد. در اين پايان نامه، ما مسئله كنترل توأم نرخ فشرده سازي (با اتلاف) و تعداد بسته هاي ارسالي در واحد زمان را براي يك گره اينترنت اشياء مجهز به منبع انرژي تجديدپذير مطرح مي كنيم. نوآوري راهكار پيشنهادي در توجه هم زمان به دو هدف بهينه سازي يعني سطح تطابق داده هاي دريافتي با داده هاي اصلي و رعايت قيد تأخير ارسال داده هاست. به علاوه، ميزان هدررفت بسته ها بابت سرريز فضاي بافر داده نيز به عنوان معيار كارايي ديگر در تابع هدف سيستم دخالت داده مي شود تا عملكرد گره به صورت يك جانبه گرايانه به افزايش سطح تطابق سوق داده نشود. براي اين منظور، با استفاده از چارچوب رياضي فرآيند تصميم ماركُفي مقيّد، مسئله را در قالب يك بهينه-سازي تصادفي طرح مي كنيم كه هدف آن بيشينه كردن متوسط سطح تطابق داده ها در بلندمدت، ضمن ايجاد محدوديت در متوسط تأخيرِ گزارش رويدادهاي حسگري است. در اين مسئله، نامقيّدسازي با روش استاندارد لاگرانژين انجام مي شود. الگوريتم هاي پيشنهادي در اين پايان نامه براي محاسبۀ سياست بهينۀ تطبيق پذير بر مبناي دو تكنيك يادگيري تقويتي سريع به نام PDS و VE است كه ميتواند با جداسازي پويايي سيستم به دو بخش قطعي و تصادفي، با اتخاذ تصميمات حريصانه و بدون نياز به دانش آماري فرآيندهاي تصادفيِ كانالِ بي-سيم، شارژ انرژي و وقوع رويدادهاي حسگري، همگرايي به سياست بهينه را تضمين نمايد. همچنين با انجام به روزرساني هاي فرصت طلبانه دسته اي قادرند در تعداد تكرار كمتر و پيچيدگي نمونه برداري پايين تر نسبت به روش هاي استاندارد يادگيري تقويتي (مثلاً: Q-learning)، همگرايي به سياست بهينه كنترلي را با سرعت بيشتري حاصل نمايند. كارايي سياستهاي پيشنهادي با الگوريتم استاندارد Q-learning مورد مقايسه قرار گرفته و به لحاظ مصرف انرژي، ميزان هدررفت بسته هاي داده و همچنين سطح تطابق داده هاي گزارش شده با انجام آزمايشات عددي تحت سناريوهاي مختلف از جمله تأثير پارامترهايي مثل حجم ورود داده ها، ميزان انرژي موجود در هر خانه بافر انرژي و ميزان جريمه هدر رفت، مورد ارزيابي قرار مي گيرند. نتايج نشان ميدهند كه ضمن رعايت قيد تأخير ارسال داده ها توسط هر سه روش، سطح تطابق داده هاي گزارش شده در روش VE نسبت به روش استاندارد Q-learning به ميزان 63.741 درصد و روش PDS نسبت به روش استاندارد Q-learning ميزان 61.845 درصد بهبود يافته است.

تاريخ ورود اطلاعات

1399/05/22

عنوان به انگليسي

Adaptive Source Coding for Delay-Constrained Data Transmission by Energy-Harvesting IoT Sensor Devices

تاريخ بهره برداري

6/2/2020 12:00:00 AM

دانشجوي وارد كننده اطلاعات

فرنوش نامجونيا

Name: فرنوش نامجونيا
Author: فرنوش نامجونيا

چكيده به لاتين

One of the important challenges in Internet of Things (IoT) is device energy limitation. The concern on energy consumption can be mitigated by exploiting technical ploys to reduce the volume of data for transmission (e.g., via sensing data compression) as well as by resorting to technological advancements (e.g., energy harvesting). To reduce the energy consumption, in this work, we propose an approach to control the joint compression rate (with loss) and the number of transmission packets per second, for an IoT node that is equipped with renewable energy resources. The proposed method focuses on two optimization goals simultaneously, that are considering fidelity of the received data with the original data as well as satisfying the data transmission delay’s constraints. In addition, the amount of packet loss due to data buffer overflow is also considered as another measure of performance in the target function of the system so that the node performance is not unilaterally driven to increase the "Fidelity level". To reach these goals, we use Constrained Markov Decision Process (CMDP) to design a stochastic optimization problem to maximize the expected value of fidelity in long term subject to the constraint of average delay of reporting sensor events. The standard Lagrangian technique is applied to make the problem unconstrained. Our proposed approach for calculating adaptive optimal policy is based-on two accelerated reinforcement-learning algorithms that are called Post Decision State (PDS) and Virtual Experience (VE). These algorithms can guarantee the convergence to the optimal policy by separating the system dynamics to known and unknown sections, only by taking a greedy decision without any statistical knowledge of wireless channel stochastic processes, energy harvesting, and sensor event occurrence. To evaluate the novel approach performance, we compare it with the standard Q-learning algorithm in terms of energy consumption, data packet loss, and data fidelity under different scenarios, including the impact of parameters such as the sense data volume on each time slot, the amount of energy buffer capacity, and the change of penalty coefficient in reward function. Consequently, the results demonstrate that the VE, 63.741% and PDS 61.845% improve data fidelity in comparison to standard Q-learning algorithm.

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=22254&Field=0&DTC=6