-
شماره ركورد
30541
-
پديد آورنده
اميرحسين گرزين
-
عنوان
شناسايي و پيشبيني ريزش كاربران در محصول نرمافزاري با استفاده از تحليل رفتار كاربر - مطالعه موردي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع
-
سال تحصيل
1400
-
تاريخ دفاع
1402/11/17
-
استاد راهنما
مهدي حيدري
-
استاد مشاور
احسان دهقاني برسياني
-
دانشكده
مهندسي صنايع
-
چكيده
افزايش رقابت در صنايع مختلف به خصوص صنعت نرمافزاري، باعث افزايش اهميت حفظ كاربران، به عنوان سوختِ اصليِ ماشينِ خلقِ ارزش براي يك محصول نرمافزاري، شدهاست. در اين ميان شناسايي و پيشبيني ريزش كاربران، راهكاري مناسب براي تشخيص نقاط ضعف و ارائه راهبردهاي جلوگيري از ريزش است.
در اين پژوهش با مطالعة رفتار 170 هزار كاربر از مجموعة ترب، به عنوان يك سكوي اينترنتي در حوزه تجارت الكترونيك، چارچوبي براي تحليلِ ريزش كاربران محصولات نرمافزاري ارائه شدهاست. به همين منظور ابتدا با جمعآوري دادههاي كليكهاي كاربران و مدلسازي بر پاية مدل احتماليِ ««بتا-هندسي/توزيع دوجملهاي غير منفي» ، احتمال ريزشِ هر كاربر محاسبه شد و احتمال ريزش بالاي 50 درصد مبناي تعيين ريزش كاربران قرار گرفت. سپس به منظور مدلسازي ويژگيهاي مرتبط با ريزش كاربران، اطلاعات مورد نياز برمبناي دانش دامنة كسبوكار مجددا جمعآوري شدند. با توجه به ماهيت نامتعادل دادهها و دربرداشتن تركيبي از ويژگيهاي رستهاي و پيوسته، عملياتهاي پيشپردازش مرتبط انجام شد. سپس مدلهاي يادگيري ماشين مبتني بر درخت، نظير؛ جنگل تصادفي، ايكسجيبوست و لايتجيبيام (به عنوان روشي نوين در اين حوزه)، آموزش داده شدند و بروي نتايج بدست آمده تحليل صورت گرفت.در مرحلة شناسايي ريزش كاربران ترب از 170 هزار كاربر، 15 هزار مورد به عنوان رويگردانده تعيين شدند. سپس با جمعآوري اطلاعات 12 ويژگي مورد نظر از كاربران، عمليات پيشپردازش، بازنمونهگيري و آموزش مدل انجام شدند. در نتايج بدست آماده براساس شاخص مساحت زير نمودار مشخصة عملكرد، تركيب آموزشيِ مدل لايتجيبيام همراه با بيشنمونهگيري تصادفي و تبديل دادههاي رستهاي با كدگذاري وانهات، عملكرد بهتري را نشان دادند. در نتايج به دست آمده، «تنوع در فروشندههاي كليك شده» و «ميانگين قيمت محصولات كليك شده» به عنوان ويژگي مهم در ريزش كاربران شناسايي شدند.
-
تاريخ ورود اطلاعات
1402/11/28
-
عنوان به انگليسي
Churn Determination and Prediction in the Software Product by Analysis in by Analysis of User Behaviour: case study
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
اميرحسين گرزين
-
چكيده به لاتين
The increase in competition in various industries, particularly the software industry, has led to an increased emphasis on retaining users as the primary fuel for creating value in software products. Determination and predicting user churn is an appropriate solution for detecting weaknesses and providing strategies to prevent churn.
In this research, a framework for analyzing user churn in software products was presented by studying the behavior of 170,000 users from the Torob, an online platform in the e-commerce domain. Initially, by collecting user click data and modeling based on the "Beta-geometric/Negative binomial distribution," the probability of user churn was calculated. A probability of churn exceeding 50% was considered as the basis for determining user churn. Subsequently, to identify attributes related to user churn, necessary information was collected based on business knowledge domian. Preprocessing operations were performed considering the imbalanced nature of the data and handling a combination of categorical and continuous features. Machine learning models based on tree ensembles, including Random Forest, XGBoost, and LightGBM, were trained as a novel approach in this domain, and the results were analyzed. In the user churn identification stage from 170,000 Torob users, 15,000 cases were determined as churn instances. Then, by collecting information on 12 relevant user attributes, preprocessing operations, resampling and model training were performed. In the obtained results, based on the AUC metric, the training combination of LightGBM model along with random oversampling and transforming categorical data using one-hot encoding showed better performance. The results further identified “diversity in clicked sellers” and “average price of clicked products” as important features in user churn.
-
كليدواژه هاي فارسي
تحليل ريزش , بتا هندسي / توزيع دوجملهاي غير منفي , لايتجيبيام , دادههاي نامتعادل , سكوهاي اينترنتي , تجارت الكترونيك
-
كليدواژه هاي لاتين
Churn Analysis , BG-NBD , LightGBM , Imbalanced , Online Platform , E-commerce
-
Author
Amirhossein Gorzin
-
SuperVisor
Mehdi Heydari
-
لينک به اين مدرک :