• شماره ركورد
    21448
  • شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
    21448
  • پديد آورنده

    الهام ولي

  • عنوان
    ارائه يك مدل تركيبي از تكنيك هاي داده كاوي براي تشخيص تقلب كارت هاي اعتباري با رويكرد حساس به هزينه
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    فناوري اطلاعات - تجارت الكترونيكي
  • تاريخ دفاع
    ارديبهشت ماه 1398
  • استاد راهنما
    دكتر عليرضا علي احمدي
  • استاد مشاور
    دكتر اصغر ابوالحسني
  • دانشكده
    صنايع
  • چكيده
    در سال هاي اخير با توجه به پيشرفت سريع تجارت الكترونيكي، استفاده از كارت هاي اعتباري به طور چشمگيري افزايش يافته است. متاسفانه استفاده متقلبانه از كارت هاي اعتباري نيز تبديل به يك منبع درآمد جذاب براي متقلبان شده و بانك ها و ديگر موسسات مالي صادركننده كارت اعتباري را با چالش هايي مواجه مي كند. بنابراين بكارگيري روش هاي تشخيص تقلب در اين زمينه از اهميت بالايي برخوردار مي باشد. از طرفي با توجه به گسترش شبكه هاي الكترونيكي و افزايش تراكنش ها، بررسي داده ها توسط انسان بسيار مشكل شده است. روش هاي داده كاوي با استفاده از شناخت دانش موجود در الگوهاي رفتاري كاربران و مشتريان، اين امر را تا حدودي آسان مي سازند. تكنيك هاي داده كاوي متعددي در زمينه تشخيص تقلب قابل استفاده مي باشد كه از ديدگاه نوع يادگيري در قالب دو گروه كلي بانظارت (دسته بندي) و بدون نظارت (خوشه بندي) قرار مي گيرد. با توجه به بررسي مطالعات پيشين، در اين تحقيق تركيبي از هر دو روش در مدل تشخيص تقلب بكار گرفته شده است. مدل تركيبي علاوه بر بكارگيري مزيت هاي هر دو روش، امكان سطح بندي روش ها به هنگام توسعه مدل را نيز فراهم مي كند. مسئله ديگر در زمينه كشف تقلب كارت اعتباري، هزينه هاي ناشي از تشخيص نادرست نوع كلاس تراكنش ها (عادي و مشكوك به تقلب) مي باشد. از اين رو در اين تحقيق يك معيار حساس به هزينه كارامد كه بتواند ميزان كارايي مدل تشخيص تقلب را از نظر هزينه تشخيص-هاي نادرست ارزيابي نمايد، ارائه مي شود. مراحل داده كاوي در اين پژوهش مطابق فرايند استاندارد CRISP-DM دنبال شد. در گام مدلسازي، مدل تركيبي پيشنهادي روي 19806 تراكنش از كارت هاي چندين بانك ايراني اجرا شد. مدلسازي شامل سه مرحله مي شود كه مراحل اول و دوم بر مبناي يادگيري بدون نظارت بوده و مرحله آخر از يادگيري بانظارت استفاده مي كند. در مرحله اول مدل، پس از خوشه بندي دارندگان كارت ها با روش هاي كوهونن، دو مرحله اي و k- ميانگين، روش كوهونن با تعداد بهينه 10 خوشه و شاخص نيمرخ 0/6 به عنوان روش خوشه بندي برتر در نظر گرفته شد. سپس در مرحله دوم، روش تحليل گروه همتا براي تعيين برچسب داده ها روي تراكنش هاي هر خوشه حاصل از روش كوهونن اجرا شد و در مجموع 329 تراكنش از كل مجموعه داده برچسب مشكوك را به خود تخصيص داد. در نهايت مجموعه داده داراي برچسب براي آموزش و آزمون روش هاي دسته بندي شبكه عصبي، شبكه بيزين، درخت تصميم، جنگل تصادفي و ماشين بردار پشتيبان مورد استفاده قرار گرفت. از ميان روش هاي دسته بندي، جنگل تصادفي با دقت 99/93 درصد و نرخ موفقيت در هزينه 99/89 درصد در مقايسه با ساير روش ها به بالاترين عملكرد دست يافت و به عنوان دسته بندي كننده برتر در نظر گرفته شد.
  • تاريخ ورود اطلاعات
    1398/09/23
  • عنوان به انگليسي
    A hybrid model of data mining techniques for credit card fraud detection using cost sensitive approach
  • تاريخ بهره برداري
    12/14/2019 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    الهام ولي

  • چكيده به لاتين
    In recent years, due to the rapid progress of e-commerce, the use of credit cards has increased dramatically. Unfortunately, the fraudulent use of credit cards has also become an attractive source of fraud for fraudsters and faces challenges for banks and other financial institutions that export credit cards. Therefore, the use of detection methods in this area is very important. On the other hand, due to the expansion of electronic networks and increased transactions, it is very difficult to handle data by humans. Data mining methods make it somewhat easier by using knowledge recognition in user and customer behavior patterns. Several data mining techniques in the field of fraud detection can be used which, from the perspective of the type of learning, are in the form of two generic groups of supervised (classification) and unsupervised (clustering). According to previous studies, in this research, a combination of both methods has been used in the fraud detection model. The combined model, in addition to utilizing the advantages of both methods, also allows for the leveling of the methods while developing the model. Another issue in the field of credit card fraud detection is the costs of inaccurate detection of transaction type classes (normal and suspected fraud). Hence, in this research, an effective cost-sensitive measure that evaluates the effectiveness of the fraud detection model in terms of the cost of inaccurate detection is presented. The data mining process was followed in accordance with the CRISP-DM standard process. In the modeling step, the proposed hybrid model was executed on the cards of several Iranian banks on the 19806 transactions. Modeling involves three stages, the first and second stages are based on unsupervised learning, and the last step is based on supervised learning. In the first stage of the model, after clustering the cardholders of two-step, k-means and kohonen methods, kohonen with optimal number of 10 clusters and silhouette index of 0.6 was considered as a Superior clustering method. Then, in the second step, the peer group analysis method was used to determine the data labels on the transactions of each cluster derived from the Kohonen method, and a total of 329 transactions from the entire data set were assigned a suspect tag. Finally, the labeled data set was used to train and test the methods of neural network classification, Bayesian network, decision tree, random forest, and support vector machine. Among the classification methods, the random forest with 99.93% accuracy and success rate of 99.89% in costs achieved the highest performance compared with other methods and considered as the best classifier.