شماره ركورد
9879
پديد آورنده
فاطمه خسروي نجف آبادي
عنوان
پيشبيني خطر سرطان پستان بر اساس فاكتورهاي خطر با استفاده از مدل جنگل تصادفي و مديريت عدم تعادل كلاس با SMOTE
مقطع تحصيلي
كارشناسي
رشته تحصيلي
علوم كامپيوتر
سال فارغ التحصيلي
1404
استاد راهنما
دكتر نجفي خواه
استاد مشاور
دكتر نجفي خواه
دانشجوي وارد كننده اطلاعات
فاطمه خسروي نجف ابادي
تاريخ ورود اطلاعات
1404/07/27
دانشكده
رياضي و علوم كامپيوتر
عنوان به انگليسي
Breast Cancer Risk Prediction Utilizing Risk Factors: A Random Forest Approach with SMOTE for Class Imbalance Management
چكيده
در اين پژوهش با هدف پيشبيني خطر ابتلا به سرطان پستان، از مدل يادگيري ماشين جنگل تصادفي و
دادههاي واقعي مجموعهي BCSC استفاده شد. دادهها شامل 12 ويژگي مرتبط با عوامل پزشكي و سبك زندگي
بودند. براي رفع عدمتعادل دادهها، از روش SMOTE استفاده و مدلها با استفاده از اعتبارسنجي متقابل ارزيابي
شدند. نتايج نشان داد مدل جنگل تصادفي پس از تنظيم ابرپارامترها به دقت 75.5 ٪ و نمره F1 معادل 0.66
دست يافت كه عملكردي بهتر از رگرسيون لجستيك داشت. عوامل كليدي پيشبيني شامل سابقه بيوپسي
پستان، شاخص توده بدني (BMI) و سن شروع قاعدگي شناسايي شدند. نتايج نشان ميدهد كه مدلهاي
يادگيري ماشين ميتوانند ابزار مؤثري براي غربالگري اوليه و شناسايي افراد در معرض خطر بالا باشند .
كليدواژه ها
سرطان پستان، يادگيري ماشين، جنگل تصادفي (Random Forest) ، رگرسيون لجستيك، عدم تعادل دادهها، روش SMOTE ، پيشبيني خطر سرطان پستان