• شماره ركورد
    34220
  • پديد آورنده

    رضا حقيقي خرم

  • عنوان
    ارائه مدل پيش بيني ريزش مشتريان در بيمه نامه‌هاي زندگي مبتني بر يادگيري ماشين با بهره‌گيري از الگوريتم‌هاي بهينه سازي (مورد مطالعه: داده‌هاي مشتريان يكي از شركت هاي بيمه در ايران)
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي فناوري اطلاعات گرايش تجارت الكترونيك
  • سال تحصيل
    1400
  • تاريخ دفاع
    1404/06/16
  • استاد راهنما
    دكتر علرضا علي‌احمدي
  • استاد مشاور
    دكتر ميترا قنبرزاده
  • دانشكده
    صنايع
  • چكيده
    صنعت بيمه به ويژه بيمه‌هاي زندگي نقش اساسي در تأمين امنيت مالي خانوارها در مواجهه با مخاطرات اقتصادي بلندمدت ايفا مي‌كند و پايداري اين صنعت به حفظ بيمه‌گذاران و كاهش نرخ بازخريد بيمه‌نامه‌ها وابسته است. با پيچيده‌تر شدن شرايط اقتصادي و افزايش رقابت در بازار بيمه، استفاده از روش‌هاي داده‌محور براي تحليل رفتار مشتريان و مديريت ريسك ريزش، ضرورتي انكارناپذير است. هدف اين پژوهش، شناسايي عوامل مؤثر بر بازخريد بيمه‌نامه‌هاي زندگي و تفكيك بيمه‌گذاران بر اساس سطح ريسك ريزش است. داده‌هاي مورد استفاده شامل اطلاعات 433٬253 بيمه‌نامه صادره طي سال‌هاي 1397 تا 1401 بوده كه متغيرهاي اقتصادي، جمعيت‌شناختي و ويژگي‌هاي قراردادي بيمه‌نامه‌ها را در بر مي‌گيرد. در مرحله پيش‌پردازش، داده‌ها پاك‌سازي شده و مسئله در قالب يك طبقه‌بندي دودويي بازخريد در برابر عدم بازخريد صورت‌بندي گرديد. براي مقابله با عدم توازن كلاس‌ها از روش بيش‌نمونه‌برداري كلاس اقليت استفاده شد و سپس سه الگوريتم تقويتي مبتني بر درخت تصميم شامل گراديان تقويتي ، گراديان تقويتي سبك و الگوريتم ويژه داده‌هاي طبقه‌اي پياده‌سازي گرديد. تنظيم ابرپارامترهاي مدل‌ها و آستانه تصميم با استفاده از الگوريتم بهينه‌سازي ابرپارامتر مبتني بر چارچوب اُپتونا انجام شد و بهترين تركيب پارامترها با هدف بيشينه‌سازي شاخص اف‌يك تعيين گرديد. نتايج ارزيابي بر روي داده‌هاي آزمون نشان داد كه دو مدل گراديان تقويتي و گراديان تقويتي سبك با دقتي در حدود 98 درصد، مقدار اف‌يك نزديك به 89 درصد و مقادير بالايي براي مساحت زير منحني مشخصه عملكرد به دست آوردند كه بيانگر توان بالاي مدل‌ها در پيش‌بيني ريزش بيمه‌نامه‌ها است. افزون بر اين، با استفاده از روش خوشه‌بندي، بيمه‌گذاران به سه سطح ريسك كم، متوسط و زياد تفكيك شدند كه اختلاف معناداري در نرخ بازخريد ميان گروه‌ها مشاهده گرديد. يافته‌ها نشان مي‌دهد مدل پيشنهادي مي‌تواند ابزار تصميم‌يار مؤثري براي مديريت ريسك و حفظ مشتريان در صنعت بيمه باشد.
  • تاريخ ورود اطلاعات
    1404/09/15
  • عنوان به انگليسي
    Presentation of a Customer Churn Prediction Model in Life Insurance Based on Machine Learning Utilizing Optimization Algorithms (Case Study:Customer Data of an Insurance Company in Iran)
  • تاريخ بهره برداري
    9/7/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    رضا حقيقي خرم

  • چكيده به لاتين
    The insurance industry, particularly life insurance, plays a fundamental role in ensuring households’ financial security against long-term economic risks, an‎d its sustainability depends heavily on customer retention an‎d the reduction of policy surrender rates. With increasing economic complexity an‎d intensified competition in the insurance market, the use of data-driven methods for customer behavior analysis an‎d churn risk management has become an undeniable necessity. The purpose of this study is to identify the key factors influencing life insurance policy surrender an‎d to segment policyholders based on their level of churn risk. The dataset used in this research consists of information from 433,253 issued life insurance policies during the period 2018–2022, including economic indicators, demographic characteristics, an‎d policy-related features. In the preprocessing stage, the data were cleaned an‎d the problem was formulated as a binary classification task between surrendered an‎d active policies. To address class imbalance, oversampling of the minority class was applied, an‎d three decision-tree-based boosting algorithms were implemented, namely Gradient Boosting, Light Gradient Boosting Machine (LightGBM), an‎d a categorical feature–specific boosting model. Hyperparameter tuning an‎d decision threshold optimization were performed using the Optuna optimization framework, an‎d the optimal model configuration was selec‎ted based on maximizing the F1-score. eva‎luation results on the test dataset indicated that both Gradient Boosting an‎d LightGBM achieved an accuracy of approximately 98%, an F1-score close to 89%, an‎d high values of the area under the ROC curve, demonstrating the strong predictive power of the models. Furthermore, clustering analysis was conducted to divide policyholders into three risk categories (low, medium, an‎d high risk), revealing statistically significant differences in surrender behavior among the groups. The findings suggest that the proposed framework can serve as an effective decision-support tool for churn risk management an‎d customer retention in the insurance industry.
  • كليدواژه هاي فارسي
    ريزش مشتري , يادگيري ماشين , الگوريتم بهينه سازي , بيمه زندگي
  • كليدواژه هاي لاتين
    Customer Churn , Machine Learning , Optimization Algorithms , Life Insurance Policies
  • Author
    Reza Haghighi Khorram
  • SuperVisor
    Alireza Aliahmadi