شماره ركورد
34576
پديد آورنده
ايسر علي
عنوان
پيش بيني ترافيك IOT با استفاده از الگوريتم VMD و روش يادگيري ماشين سبك بر اساس شبكه ترانسفورماتور هيبريدي و مجموعه اي از مدل هاي رگرسيون
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
شبگه هاي كامپيوتر
سال تحصيل
1404
تاريخ دفاع
1404/11/19
استاد راهنما
دكتر ناصر مزياني
استاد مشاور
استاد مشاور
دانشكده
مهندس كامبيوتر
چكيده
چكيـده
پيشرفتهاي سريع در حوزه اينترنت اشيا (IoT) پيشبيني دقيق ترافيك شبكه و سطوح امنيتي را با چالشهاي جدي مواجه كرده است. اين مسئله بهويژه در زمان وقوع حملات محرومسازي از سرويس توزيعشده (DDoS) بيشتر نمايان ميشود، زيرا سطح ترافيك در اين شرايط غيرايستا بوده و نوسانات و اختلافات قابلتوجهي را نشان ميدهد. در چنين شرايطي، دستيابي به دقت بالا با استفاده از روشهاي سنتي پيشبيني و حتي معماريهاي پيشرفته يادگيري عميق كه تحت محدوديتهاي رايج دستگاههاي مبتني بر IoT اجرا ميشوند، بسيار دشوار است.در اين پاياننامه، يك رويكرد تركيبي نوين ارائه شده است كه شامل تجزيه مدهاي وارياسيوني (VMD)، سازوكارهاي توجه مبتني بر Transformer و پيشبيني مبتني بر الگوريتم Random Forest ميباشد. كل سامانه به گونهاي طراحي شده است كه يك معماري سبكوزن را با بهرهگيري از رمزگذار Transformer شامل تنها دو لايه و تعبيههاي برداري با بُعد 64 فراهم ميكند.
اين مطالعه ترافيك شبكه را با استفاده از ويژگي تعداد مبدأ (source count) بستههاي شبكه در مجموعهداده DataSense Industrial IoT بهصورت سيگنال پردازش ميكند. اين مجموعهداده بستههاي منفرد شبكه را بهصورت ويژگيهاي آماري كه در بازههاي زماني يكثانيهاي جمعآوري شدهاند، تجميع ميكند. بين ويژگيهاي آماري ترافيك عادي (ميانگين = 7.61 بسته در ثانيه، انحراف معيار = 13.14) و ترافيك حمله (ميانگين = 2088.52 بسته در ثانيه، انحراف معيار = 7780.08) فاصله بسيار زيادي وجود دارد. بنابراين، براي پايدارسازي واريانس، لازم است از تابع log1p استفاده شود تا دادهها به حوزه لگاريتمي تبديل شوند.در مرحله پيشپردازش، روش تجزيه مدهاي وارياسيوني (VMD) سيگنالهاي مورد تحليل را به پنج تابع مد ذاتي (IMF) با مؤلفههاي فركانسي متفاوت تجزيه ميكند. سپس، سازوكار توجه خودي چندسري (multi-head self-attention) الگوهاي زماني سلسلهمراتبي را استخراج ميكند. در نهايت، مدل Random Forest قادر است نتايج نهايي را با دقت بالا پيشبيني كند؛ بهگونهاي كه اين پيشبينيها تحت تأثير تغييرات توزيع ناشي از حملات قرار نميگيرند.
اعتبارسنجي آزمايشي بر روي بنچمارك DataSense نشان ميدهد كه چارچوب پيشنهادي عملكرد بهتري نسبت به سه روش پايه دارد: شبكههاي LSTM، يك Transformer مستقل بدون پيشپردازش، و مدل متداول Random Forest. ميزان بهبود در معيار RMSE بهترتيب برابر با 60.38٪، 84.91٪ و 87.69٪ گزارش شده است.روش پيشنهادي داراي خطاي ريشه ميانگين مربعات (RMSE) برابر با 0.08، مقدار R² معادل 0.9704، و انحراف معيار خطا برابر با 0.08 ميباشد. همچنين، اين روش سريعترين زمان تأخير در مرحله استنتاج را با مقدار 0.0099 ميليثانيه براي هر نمونه ارائه ميدهد، كه آن را براي استفاده بلادرنگ در محيطهاي IoT با منابع محدود كه نيازمند تشخيص پيشدستانه تهديدات و سياستهاي امنيتي انعطافپذير هستند، بسيار مناسب ميسازد.
تاريخ ورود اطلاعات
1404/12/05
عنوان به انگليسي
Iot Traffic Prediction Using VMD Algorithm and Lightweight Machine Learning Method Based On Hybrid Transformer Network and Ensemble Of Regression Models
تاريخ بهره برداري
2/8/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
ايسر علي
چكيده به لاتين
The quick advancements made in the Internet of Things (IoT) have made it quite tough to make precise predictions regarding the network traffic and security levels. This is particularly observed during Distributed Denial of Service (DDoS) attacks because the traffic levels remain quite non-stationary and exhibit large differences. It is quite tough to remain precise and accurate with the traditional forecasting methods and even the more powerful deep learning architectures running under the traditional constraints of IoT-based devices. A completely new hybrid approach is being presented in the thesis that includes Variational Mode Decomposition (VMD), Transformer-based attention mechanisms, and Random Forest-based predictions. The whole system is designed in a way that facilitates a lightweight design using the Transformer encoder with only two layers and 64-dimensional embeddings.
This study processes the network traffic as signals by using the source count feature of the network packets in the DataSense Industrial IoT dataset. This dataset aggregates the individual network packets as statistical features collected at one-second intervals. There is a large gap between the statistical characteristics of benign traffic (mean = 7.61 packets/s-standard deviation = 13.14) and coloured traffic (mean = 2088.52 packets/s-standard deviation = 7780.08). Therefore, we need to apply the log1p function to transform the data into a log domain to stabilize the variance. VMD preprocessing decomposes the analyzed signals into five intrinsic mode functions for different frequency components of the signals. The multi-head self-attention function extracts hierarchical temporal signals. The Random Forest model can accurately predict the final results, which are not affected by changes in distribution due to attacks.
Experimental validation on the DataSense benchmark shows that the framework is better than three baseline methods: LSTM networks, a standalone Transformer without preprocessing, and a conventional Random Forest. The improvements in RMSE were 60.38%, 84.91%, and 87.69%, respectively. The suggested method has a root mean square error (RMSE) of 0.08, a R² score of 0.9704, and an error standard deviation of 0.08. It also has the fastest inference latency of 0.0099 milliseconds per sample, which makes it perfect for real-time use in IoT environments with limited resources that need proactive threat detection and flexible security policies.
كليدواژه هاي فارسي
پيشبيني ترافيك IoT , تجزيه مداري متغير VMD , شبكههاي ترنسفورمر
كليدواژه هاي لاتين
IoT Traffic Prediction , Variational Mode Decomposition , Transformer Networks
Author
Aysar Ali
SuperVisor
Dr. Naser Mozayani