شماره ركورد
33468
پديد آورنده
طه نخعي
عنوان
پيشبيني سرطان پروستات مبتني بر مدلهاي يادگيري ماشين
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي فناوري اطلاعات - تجارت الكترونيكي
سال تحصيل
1400
تاريخ دفاع
1403/12/14
استاد راهنما
دكتر محمد فتحيان
استاد مشاور
/
دانشكده
مهندسي صنايع
چكيده
امروزه پيشرفت هوشمصنوعي و ظهور يادگيري ماشين توانسته بسياري از صنايع، به ويژه حوزهي مراقبتهاي بهداشتي و پزشكي را تحت تأثير قرار دهد. علاوه بر آن با توسعه فناوريهاي پزشكي توانسته در تشخيص، پيشآگاهي و پيشبيني انواع سرطان عملكرد قابل توجهي داشته باشد. در سالهاي اخير بيماري سرطان به يكي از نگرانيهاي بهداشتي در سراسر جهان تبديل شده است. يكي از سرطانهاي شايع در ميان مردان سرطان پروستات است، كه درسالهاي ابتدايي ابتلا اغلب بدون علامت ميباشد. همچنين افراد مسن و ميانسال بيشتر به اين سرطان مبتلا شده و همين علت باعث مرگ بسياري از بيماران ميشود. در صورت بدخيم بودن سرطان پروستات باعث گسترش به اندامهاي ديگر از جمله ستون فقرات، لگن و ... شده و اغلب مواقع با درد و شكستگي استخوان و اختلالات حركتي همراه است. مطالعات بسياري توسط محققان در اين حوزه انجام شده كه بر مبناي مدلهاي يادگيري ماشين به پيشبيني، انتخاب مشخصهها، انتخاب ژنهاي مؤثر در سرطان و ... پرداخته شده است. هدف از اين پژوهش ارائه مدل يادگيري جمعي جهت پيشبيني زودهنگام سرطان پروستات با استفاده از رويكرد طبقهبندي است. كه توسط سه مجموعهداده داراي مشخصات باليني، تصويربرداري، سبكزندگي و جمعيت شناختي شامل بيماران مشكوك و داراي سرطان پروستات صورت گرفته است. براي مدلسازي الگوريتم يادگيري ماشين در ابتدا به آمادهسازي دادهها پرداخته و پس از آن آموزش مدل و تنظيم فراپارامترها صورت گرفت، سپس علاوه بر الگوريتمهاي يادگيري ماشين از دو الگوريتم جمعي جنگلتصادفي و درخت فوقالعاده تصادفي به عنوان الگوريتمهاي پايه براي ساخت مدلهاي يادگيري جمعي استفاده و پس از آموزش و تنظيم فراپارامترها، مدل نهايي با بهترين عملكرد انتخاب گرديد. سپس عملكرد الگوريتمهاي يادگيري جمعي و الگوريتمهاي يادگيري ماشين مورد بررسي قرار گرفت. مطابق انتظار اكثر الگوريتمهاي جمعي عملكرد بهتري نسبت به الگوريتمهاي پايه داشتهاند. همچنين الگوريتمهاي فزونسازي گراديان فوقالعاده (دقت 82٪)، فزونسازي تطبيقي (دقت 2/96٪) و پشتهسازي (دقت 4/99٪) به ترتيب در مجموعههاي اول تا سوم بهترين عملكرد و همچنين در مجموع سه الگوريتم رأيگيري، بقچهسازي و پشتهسازي داراي عملكرد بهتري نسبت به ساير الگوريتمهاي جمعي در سه مجموعه داده داشتهاند. سپس تأثير آنتيژن اختصاصي پروستات بر روي دو مجموعه بررسي شد. كه با توجه به نتايج بدست آمده آنتيژن اختصاصي پروستات تأثير مثبتي بر مدلهاي پيشبيني داشته است. سرانجام با استفاده از قواعد انجمني به استخراج قواعدي مرتبط با شيوه زندگي از بيماران مبتلا به سرطان پروستات به منظور پيشآگاهي مورد بررسي قرار گرفت. پس از آمادهسازي دادهها با استفاده از الگوريتم اپريوري و پشتيبان 1/0 الگوهاي مكرر استخراج و پس از آن قواعد انجمني با اطمينان 4/0 توليد گرديد. سپس قواعدي با عبارت تالي وجود سرطان پروستات به عنوان قواعد نهايي انتخاب شدهاند. بهترين قواعد با پشتيبان 929/0 و خيزش 85/1، پشتيبان 643/0 و خيزش 353/1 به ترتيب در مجموعه دادههاي دوم و سوم معرفي گرديدند.
تاريخ ورود اطلاعات
1404/04/09
عنوان به انگليسي
Prostate cancer prediction based on machine learning models
تاريخ بهره برداري
3/5/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
طه نخعي
چكيده به لاتين
The rapid advancement of artificial intelligence (AI) and the emergence of machine learning (ML) have profoundly influenced various industries, notably healthcare and medicine. In particular, the integration of AI with medical technologies has enhanced capabilities in the diagnosis, prognosis, and prediction of various cancers. Prostate cancer, one of the most common malignancies among men, often progresses asymptomatically in its early stages and predominantly affects middle-aged and elderly individuals, contributing significantly to cancer-related mortality. If malignant, the cancer may metastasize to other organs, such as the spine and pelvis, often resulting in pain, bone fractures, and motor impairments. This study proposes an ensemble learning-based model for the early prediction of prostate cancer using a classification approach. To achieve this, three datasets comprising clinical, imaging, lifestyle, and demographic features were utilized, including data from both suspected and confirmed prostate cancer cases. The modeling process involved comprehensive data preprocessing, model training, and hyperparameter tuning. In addition to conventional ML algorithms, two ensemble methods, Random Forest (RF) and Extremely Randomized Trees (ExtraTrees), were employed as base learners for ensemble construction. Following training, the best-performing models were selected based on classification accuracy. The results demonstrate that ensemble models consistently outperformed individual classifiers. Specifically, Extreme Gradient Boosting (XGBoost) achieved an accuracy of 82% on the first dataset, Adaptive Boosting (AdaBoost) reached 96.2% on the second dataset, and Stacking achieved 99.4% accuracy on the third dataset. Moreover, the ensemble methods of voting, bagging, and stacking showed superior overall performance across all datasets. The influence of prostate-specific antigen (PSA) was also analyzed, revealing a positive effect on predictive performance. Furthermore, association rule mining was applied to identify lifestyle-related patterns associated with prostate cancer. Using the Apriori algorithm with a minimum support of 0.1 and a minimum confidence of 0.4, frequent patterns and association rules were extracted. Final rules indicating prostate cancer presence in the consequent were selected, with the most significant rules achieving a support of 0.929 and a lift of 1.85 in the second dataset, and a support of 0.643 and a lift of 1.353 in the third dataset.
كليدواژه هاي فارسي
سرطان پروستات , يادگيري ماشين , يادگيري جمعي , قواعد انجمني
كليدواژه هاي لاتين
Prostate Cancer , Machine Learning , Ensemble Learning , Association Rules
Author
Taha Nakhaei
SuperVisor
Mohammad Fathian