شماره ركورد
31567
پديد آورنده
فاطمه زهرا فيضي
عنوان
ناهنجارشناسي در دادههاي گرافي با استفاده از روشهاي يادگيري عميق
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
سال تحصيل
1400
تاريخ دفاع
1402/11/28
استاد راهنما
حسين رحماني
استاد مشاور
حسين رحماني
دانشكده
كامپيوتر
چكيده
در سالهاي اخير، دادههاي گرافي موردتوجه زيادي قرار گرفتهاند؛ زيرا از آنها بهمنظور بازنمايي انواع ديگري از دادهها از جمله دادههاي شبكه اجتماعي، بانكي، امنيتي، امور مالي، پزشكي و متني نيز استفاده ميشود. ازاينرو تشخيص ناهنجاري در اين دادهها به دليل پيامدهاي ناگوار آنها موردتوجه فزايندهاي قرار گرفته است و قدرت خود را در جلوگيري از رويدادهاي مخربي مانند كلاهبرداري مالي، نفوذ در شبكه و هرزنامههاي اجتماعي نشان داده است. بهطوركلي، ناهنجاري، الگوهايي در دادهها هستند كه با مفهوم تعريف شده از رفتار عادي مطابقت ندارند. چنين ناهنجارهايي در دادههاي گرافي ممكن است به چند صورت ديده شوند 1- ناهنجاري در گره، 2- ناهنجاري در يال، 3- ناهنجاري در زيرگراف، 4- ناهنجاري در گراف. ناهنجاري مربوط به گره ممكن است به دليل غيرعادي بودن ساختار يا ويژگيها يا هر دو باشد. از سوي ديگر ناهنجاريهاي مربوط به يال برخلاف تشخيص ناهنجاريهاي گره كه گرههاي منفرد را هدف قرار ميدهد، هدف تشخيص يال ناهنجار شناسايي پيوندهاي غيرعادي است. اين پيوندها اغلب روابط غيرمنتظره يا غيرمعمول بين اشيا واقعي، مانند تعاملات غيرعادي بين كلاهبرداران و كاربران خوشخيم، يا تعاملات مشكوك بين گرههاي مهاجم و خوشخيم در شبكههاي كامپيوتري هستند. چالش اصلي در اين زمينه شناسايي اين ناهنجاريها و ردهبندي آنها است. در سالهاي اخير روشهاي محاسباتي بسياري براي پيشبيني ناهنجاري در گراف ايجاد شده است. اين روشها ميتوانند ناهنجاريها را در گراف تشخيص دهند. اين روشهاي محاسباتي بهطوركلي به دودسته مبتني بر تجزيهوتحليل آماري و مبتني بر يادگيري ماشين است.
ما در اين پژوهش، از طريق بهكارگيري روشهاي ناهنجارشناسي در سطح گره به ارائه «يك چارچوب شناسايي ناهنجاري در سطح گره» با رويكرد الگوريتمهاي يادگيري عميق و گروهي ميپردازيم. در اين پژوهش سعي شد، چارچوب پيشنهادي بر روي گرافهاي نامتجانس برچسبدار، اِعمال و نتايج آن با ساير الگوريتمهاي شناسايي گره ناهنجار بهصورت كمي و كيفي مقايسه گردد.
ارزيابي كمي چارچوب «GRAPH-Guard» بر روي گراف نامتجانس برچسبدار، نشان داد بهكارگيري چارچوب پيشنهادي، باعث افزايش دقت، بر اساس معيار AUC (+4) نسبت به ميانگين كارهاي پيشين و (+1) F1 نسبت به بهترين مقدار در كارهاي پيشين شده و در مقايسه با ساير الگوريتمهاي شناسايي گره ناهنجار بهترين عملكرد را به ارمغان ميآورد.
تاريخ ورود اطلاعات
1403/08/15
عنوان به انگليسي
Anomaly detection in graph data using deep learning methods
تاريخ بهره برداري
2/16/2025 12:00:00 AM
دانشجوي وارد كننده اطلاعات
فاطمه زهرا فيضي
چكيده به لاتين
In recent years, graph data has received a lot of attention; Because they are also used to represent other types of data, including social network, banking, security, financial, medical, and textual data. Therefore, the detection of anomalies in these data has received increasing attention due to their unfortunate consequences and has shown its power in preventing destructive events such as financial fraud, network intrusion, and social spam. In general, anomalies are patterns in data that do not conform to the defined concept of normal behavior. Such anomalies in graph data may be seen in several ways: 1- Anomaly in the node, 2- Anomaly in the edge, 3- Anomaly in the subgraph, 4- Anomaly in the graph. A nodal abnormality may be due to abnormal structure or features or both. On the other hand, edge-related anomalies, unlike node anomaly detection, which targets individual nodes, the purpose of edge anomaly detection is to identify abnormal links. These links are often unexpected or unusual relationships between real objects, such as unusual interactions between fraudsters and benign users, or suspicious interactions between attacker nodes and benign user machines in computer networks. The main challenge in this field is to identify these abnormalities and classify them. In recent years, many computational methods have been developed to predict anomalies in graphs. These methods can detect anomalies in the graph. These calculation methods are generally divided into two categories based on statistical analysis and based on machine learning.
In this research, through the application of anomaly detection methods at the node level, we present "an anomaly identification framework at the node level" with the approach of deep and ensemble learning algorithms. In this research, it was tried to apply the proposed framework on labeled hetrogeneous graphs and compare its results with other algorithms for identifying anomalous nodes quantitatively and qualitatively.
A quantitative evaluation of the "GRAPH-Guard" framework on heterogeneous labeled graphs showed that using the proposed framework results in increased accuracy, based on the AUC metric (+4) compared to previous works' average and (+1) F1 compared to the best value in previous works
كليدواژه هاي فارسي
كشف ناهنجاري , يادگيري ماشين , دادههاي گراف , يادگيري گروهي , دادهكاوي
كليدواژه هاي لاتين
anomaly detection , machine learning , graph data , ensemble learning , data mining
Author
fatemehzhara feizi
SuperVisor
Dr. hossein rahmani