ميرحسن نيكنام تقي پور

عنوان

بكارگيري الگوريتم‌هاي داده كاوي و بررسي تاثير روش‌هاي متفاوت نمونه‌برداري بر داده‌هاي نامتوازن (مطالعه موردي: كشف تقلبات يك شركت بيمه‌گر خودرو)

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي صنايع

سال تحصيل

1396

تاريخ دفاع

1399/9/30

استاد راهنما

دكتر رسول نورالسناء

دانشكده

صنايع

چكيده

تقلب در بيمه خودرو، سهم زيادي از هزينه‌هاي بيمه را شامل مي‌شوند و بر استراتژي‌هاي اساسي سازمان و منافع اقتصادي در بلند مدت تاثير گذار است. كشف تقلب در بيمه خودرو براي كاهش هزينه‌هاي شركت‌هاي بيمه بسيار حياتي هستند. هدف از اين مقاله ، بررسي روش‌هاي مختلف آماري، داده‌كاوي و الگوريتم‌هاي يادگيري‌ماشين جهت پيش‌بيني ادعاهاي تقلب و كلاهبرداري در بيمه شدگان بيمه‌ي خودرو است تا به صنعت بيمه جهت پيشگيري از چنين تخلفاتي كمك كند. ما در اين تحقيق، با استفاده از مجموعه داده‌ هاي نامتوازن ابتدا با استفاده از چهار روش به متوازن سازي داده‌ها مي‌پردازيم سپس با استفاده از چهار مدل به پيش‌بيني تقلب مي‌پردازيم. در نهايت با تركيب كردن نتايج حاصل از روش‌هاي مختلف متوازن سازي و مدل‌هاي يادگيري ماشين به ارزيابي نتايج مي‌پردازيم.

تاريخ ورود اطلاعات

1402/04/10

عنوان به انگليسي

Applying data mining algorithms and investigating the effect of different sampling methods on unbalanced data (case study: fraud detection of a car insurance company)

تاريخ بهره برداري

12/21/2021 12:00:00 AM

دانشجوي وارد كننده اطلاعات

ميرحسن نيكنام تقي پور

Name: ميرحسن نيكنام تقي پور
Author: ميرحسن نيكنام تقي پور

چكيده به لاتين

Car insurance fraud accounts for a significant percentage of insurance costs and affects the organization's core strategies and long-term economic and social benefits. Detecting car insurance fraud is very important to reduce the costs of insurance companies. The purpose of this study is to investigate different statistical data mining methods as well as machine-learning classification algorithms to predict fraud claims in car insurance policyholders and help the insurance industry. Using the original unbalanced data set we tempted to balance them first using four methods, then we classified our data using four different classification models to predict fraud cases. Finally, we compared the results by combining balancing methods and classification models.

كليدواژه هاي فارسي

كشف_تقلب , داده_كاوي , تحقيق_آماري , يادگيري_ماشين , علم_داده

كليدواژه هاي لاتين

fraud_detection , data_science , machine_learning

Author

Hasan Niknam

SuperVisor

Dr. Rassol nurossana

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=28484&Field=0&DTC=6