• شماره ركورد
    31567
  • پديد آورنده

    فاطمه زهرا فيضي

  • عنوان
    ناهنجارشناسي در داده‌هاي گرافي با استفاده از روش‌هاي يادگيري عميق
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر - نرم افزار
  • سال تحصيل
    1400
  • تاريخ دفاع
    1402/11/28
  • استاد راهنما
    حسين رحماني
  • استاد مشاور
    حسين رحماني
  • دانشكده
    كامپيوتر
  • چكيده
    در سال‌هاي اخير، داده‌هاي گرافي موردتوجه زيادي قرار گرفته‌اند؛ زيرا از آن‌ها به‌منظور بازنمايي انواع ديگري از داده‌ها از جمله داده‌هاي شبكه اجتماعي، بانكي، امنيتي، امور مالي، پزشكي و متني نيز استفاده مي‌شود. ازاين‌رو تشخيص ناهنجاري در اين داده‌ها به دليل پيامدهاي ناگوار آن‌ها موردتوجه فزاينده‌اي قرار گرفته است و قدرت خود را در جلوگيري از رويدادهاي مخربي مانند كلاهبرداري مالي، نفوذ در شبكه و هرزنامه‌هاي اجتماعي نشان داده است. به‌طوركلي، ناهنجار‌ي، الگوهايي در داده‌ها هستند كه با مفهوم تعريف شده از رفتار عادي مطابقت ندارند. چنين ناهنجار‌هايي در داده‌هاي گرافي ممكن است به چند صورت ديده شوند 1- ناهنجاري در گره، 2- ناهنجاري در يال، 3- ناهنجاري در زيرگراف، 4- ناهنجاري در گراف. ناهنجاري مربوط به گره ممكن است به دليل غيرعادي بودن ساختار يا ويژگي‌ها يا هر دو باشد. از سوي ديگر ناهنجاري‌هاي مربوط به يال برخلاف تشخيص ناهنجاري‌هاي گره كه گره‌هاي منفرد را هدف قرار مي‌دهد، هدف تشخيص يال ناهنجار شناسايي پيوندهاي غيرعادي است. اين پيوندها اغلب روابط غيرمنتظره يا غيرمعمول بين اشيا واقعي، مانند تعاملات غيرعادي بين كلاهبرداران و كاربران خوش‌خيم، يا تعاملات مشكوك بين گره‌هاي مهاجم و خوش‌خيم در شبكه‌هاي كامپيوتري هستند. چالش اصلي در اين زمينه شناسايي اين ناهنجاري‌ها و رده‌بندي آن‌ها است. در سال‌هاي اخير روش‌هاي محاسباتي بسياري براي پيش‌بيني ناهنجاري در گراف ايجاد شده است. اين روش‌ها مي‌توانند ناهنجاري‌ها را در گراف تشخيص دهند. اين روش‌هاي محاسباتي به‌طوركلي به دودسته مبتني بر تجزيه‌وتحليل آماري و مبتني بر يادگيري ماشين است. ما در اين پژوهش، از طريق به‌كارگيري روش‌هاي ناهنجارشناسي در سطح گره به ارائه «يك چارچوب شناسايي ناهنجاري در سطح گره» با رويكرد الگوريتم‌هاي يادگيري عميق و گروهي مي‌پردازيم. در اين پژوهش سعي شد، چارچوب پيشنهادي بر روي گراف‌هاي نامتجانس برچسب‌دار، اِعمال و نتايج آن با ساير الگوريتم‌هاي شناسايي گره ناهنجار به‌صورت كمي و كيفي مقايسه گردد. ارزيابي كمي چارچوب «GRAPH-Guard» بر روي گراف نامتجانس برچسب‌دار، نشان داد به‌كارگيري چارچوب پيشنهادي، باعث افزايش دقت، بر اساس معيار AUC (+4) نسبت به ميانگين كارهاي پيشين و (+1) F1 نسبت به بهترين مقدار در كارهاي پيشين شده و در مقايسه با ساير الگوريتم‌هاي شناسايي گره ناهنجار بهترين عملكرد را به ارمغان مي‌آورد.
  • تاريخ ورود اطلاعات
    1403/08/15
  • عنوان به انگليسي
    Anomaly detection in graph data using deep learning methods
  • تاريخ بهره برداري
    2/16/2025 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    فاطمه زهرا فيضي

  • چكيده به لاتين
    In recent years, graph data has received a lot of attention; Because they are also used to represent other types of data, including social network, banking, security, financial, medical, and textual data. Therefore, the detection of anomalies in these data has received increasing attention due to their unfortunate consequences and has shown its power in preventing destructive events such as financial fraud, network intrusion, and social spam. In general, anomalies are patterns in data that do not conform to the defined concept of normal behavior. Such anomalies in graph data may be seen in several ways: 1- Anomaly in the node, 2- Anomaly in the edge, 3- Anomaly in the subgraph, 4- Anomaly in the graph. A nodal abnormality may be due to abnormal structure or features or both. On the other hand, edge-related anomalies, unlike node anomaly detection, which targets individual nodes, the purpose of edge anomaly detection is to identify abnormal links. These links are often unexpected or unusual relationships between real objects, such as unusual interactions between fraudsters and benign users, or suspicious interactions between attacker nodes and benign user machines in computer networks. The main challenge in this field is to identify these abnormalities and classify them. In recent years, many computational methods have been developed to predict anomalies in graphs. These methods can detect anomalies in the graph. These calculation methods are generally divided into two categories based on statistical analysis and based on machine learning. In this research, through the application of anomaly detection methods at the node level, we present "an anomaly identification framework at the node level" with the approach of deep and ensemble learning algorithms. In this research, it was tried to apply the proposed framework on labeled hetrogeneous graphs and compare its results with other algorithms for identifying anomalous nodes quantitatively and qualitatively. A quantitative eva‎luation of the "GRAPH-Guard" framework on heterogeneous labeled graphs showed that using the proposed framework results in increased accuracy, based on the AUC metric (+4) compared to previous works' average and (+1) F1 compared to the best value in previous works
  • كليدواژه هاي فارسي
    كشف ناهنجاري , يادگيري ماشين , داده‌هاي گراف , يادگيري گروهي , داده‌كاوي
  • كليدواژه هاي لاتين
    anomaly detection , machine learning , graph data , ensemble learning , data mining
  • Author
    fatemehzhara feizi
  • SuperVisor
    Dr. hossein rahmani