شماره ركورد
34220
پديد آورنده
رضا حقيقي خرم
عنوان
ارائه مدل پيش بيني ريزش مشتريان در بيمه نامههاي زندگي مبتني بر يادگيري ماشين با بهرهگيري از الگوريتمهاي بهينه سازي (مورد مطالعه: دادههاي مشتريان يكي از شركت هاي بيمه در ايران)
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي فناوري اطلاعات گرايش تجارت الكترونيك
سال تحصيل
1400
تاريخ دفاع
1404/06/16
استاد راهنما
دكتر علرضا علياحمدي
استاد مشاور
دكتر ميترا قنبرزاده
دانشكده
صنايع
چكيده
صنعت بيمه به ويژه بيمههاي زندگي نقش اساسي در تأمين امنيت مالي خانوارها در مواجهه با مخاطرات اقتصادي بلندمدت ايفا ميكند و پايداري اين صنعت به حفظ بيمهگذاران و كاهش نرخ بازخريد بيمهنامهها وابسته است. با پيچيدهتر شدن شرايط اقتصادي و افزايش رقابت در بازار بيمه، استفاده از روشهاي دادهمحور براي تحليل رفتار مشتريان و مديريت ريسك ريزش، ضرورتي انكارناپذير است. هدف اين پژوهش، شناسايي عوامل مؤثر بر بازخريد بيمهنامههاي زندگي و تفكيك بيمهگذاران بر اساس سطح ريسك ريزش است.
دادههاي مورد استفاده شامل اطلاعات 433٬253 بيمهنامه صادره طي سالهاي 1397 تا 1401 بوده كه متغيرهاي اقتصادي، جمعيتشناختي و ويژگيهاي قراردادي بيمهنامهها را در بر ميگيرد. در مرحله پيشپردازش، دادهها پاكسازي شده و مسئله در قالب يك طبقهبندي دودويي بازخريد در برابر عدم بازخريد صورتبندي گرديد. براي مقابله با عدم توازن كلاسها از روش بيشنمونهبرداري كلاس اقليت استفاده شد و سپس سه الگوريتم تقويتي مبتني بر درخت تصميم شامل گراديان تقويتي ، گراديان تقويتي سبك و الگوريتم ويژه دادههاي طبقهاي پيادهسازي گرديد.
تنظيم ابرپارامترهاي مدلها و آستانه تصميم با استفاده از الگوريتم بهينهسازي ابرپارامتر مبتني بر چارچوب اُپتونا انجام شد و بهترين تركيب پارامترها با هدف بيشينهسازي شاخص افيك تعيين گرديد. نتايج ارزيابي بر روي دادههاي آزمون نشان داد كه دو مدل گراديان تقويتي و گراديان تقويتي سبك با دقتي در حدود 98 درصد، مقدار افيك نزديك به 89 درصد و مقادير بالايي براي مساحت زير منحني مشخصه عملكرد به دست آوردند كه بيانگر توان بالاي مدلها در پيشبيني ريزش بيمهنامهها است. افزون بر اين، با استفاده از روش خوشهبندي، بيمهگذاران به سه سطح ريسك كم، متوسط و زياد تفكيك شدند كه اختلاف معناداري در نرخ بازخريد ميان گروهها مشاهده گرديد. يافتهها نشان ميدهد مدل پيشنهادي ميتواند ابزار تصميميار مؤثري براي مديريت ريسك و حفظ مشتريان در صنعت بيمه باشد.
تاريخ ورود اطلاعات
1404/09/15
عنوان به انگليسي
Presentation of a Customer Churn Prediction Model in Life Insurance Based on Machine Learning Utilizing Optimization Algorithms (Case Study:Customer Data of an Insurance Company in Iran)
تاريخ بهره برداري
9/7/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
رضا حقيقي خرم
چكيده به لاتين
The insurance industry, particularly life insurance, plays a fundamental role in ensuring households’ financial security against long-term economic risks, and its sustainability depends heavily on customer retention and the reduction of policy surrender rates. With increasing economic complexity and intensified competition in the insurance market, the use of data-driven methods for customer behavior analysis and churn risk management has become an undeniable necessity. The purpose of this study is to identify the key factors influencing life insurance policy surrender and to segment policyholders based on their level of churn risk.
The dataset used in this research consists of information from 433,253 issued life insurance policies during the period 2018–2022, including economic indicators, demographic characteristics, and policy-related features. In the preprocessing stage, the data were cleaned and the problem was formulated as a binary classification task between surrendered and active policies. To address class imbalance, oversampling of the minority class was applied, and three decision-tree-based boosting algorithms were implemented, namely Gradient Boosting, Light Gradient Boosting Machine (LightGBM), and a categorical feature–specific boosting model.
Hyperparameter tuning and decision threshold optimization were performed using the Optuna optimization framework, and the optimal model configuration was selected based on maximizing the F1-score. evaluation results on the test dataset indicated that both Gradient Boosting and LightGBM achieved an accuracy of approximately 98%, an F1-score close to 89%, and high values of the area under the ROC curve, demonstrating the strong predictive power of the models. Furthermore, clustering analysis was conducted to divide policyholders into three risk categories (low, medium, and high risk), revealing statistically significant differences in surrender behavior among the groups. The findings suggest that the proposed framework can serve as an effective decision-support tool for churn risk management and customer retention in the insurance industry.
كليدواژه هاي فارسي
ريزش مشتري , يادگيري ماشين , الگوريتم بهينه سازي , بيمه زندگي
كليدواژه هاي لاتين
Customer Churn , Machine Learning , Optimization Algorithms , Life Insurance Policies
Author
Reza Haghighi Khorram
SuperVisor
Alireza Aliahmadi