• شماره ركورد
    33468
  • پديد آورنده

    طه نخعي

  • عنوان
    پيش‌بيني سرطان پروستات مبتني بر مدل‌هاي يادگيري ماشين
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي فناوري اطلاعات - تجارت الكترونيكي
  • سال تحصيل
    1400
  • تاريخ دفاع
    1403/12/14
  • استاد راهنما
    دكتر محمد فتحيان
  • استاد مشاور
    /
  • دانشكده
    مهندسي صنايع
  • چكيده
    امروزه پيشرفت هوش‌مصنوعي و ظهور يادگيري ماشين توانسته بسياري از صنايع، به ويژه حوزه‌ي مراقبت‌هاي بهداشتي و پزشكي را تحت تأثير قرار دهد. علاوه بر آن با توسعه فناوري‌هاي پزشكي توانسته در تشخيص، پيش‌آگاهي و پيش‌بيني انواع سرطان عملكرد قابل توجهي داشته باشد. در سال‌هاي اخير بيماري سرطان به يكي از نگراني‌هاي بهداشتي در سراسر جهان تبديل شده است. يكي از سرطان‌هاي شايع در ميان مردان سرطان پروستات است، كه درسال‌هاي ابتدايي ابتلا اغلب بدون علامت مي‌باشد. همچنين افراد مسن و ميان‌سال بيشتر به اين سرطان مبتلا شده و همين علت باعث مرگ بسياري از بيماران مي‌شود. در صورت بدخيم بودن سرطان پروستات باعث گسترش به اندام‌هاي ديگر از جمله ستون فقرات، لگن و ... شده و اغلب مواقع با درد و شكستگي استخوان و اختلالات حركتي همراه است. مطالعات بسياري توسط محققان در اين حوزه انجام شده كه بر مبناي مدل‌هاي يادگيري ماشين به پيش‌بيني، انتخاب مشخصه‌ها، انتخاب ژن‌هاي مؤثر در سرطان و ... پرداخته شده است. هدف از اين پژوهش ارائه مدل يادگيري جمعي جهت پيش‌بيني زودهنگام سرطان پروستات با استفاده از رويكرد طبقه‌بندي است. كه توسط سه مجموعه‌داده داراي مشخصات باليني، تصوير‌برداري، سبك‌زندگي و جمعيت ‌شناختي شامل بيماران مشكوك و داراي سرطان پروستات صورت گرفته است. براي مدل‌سازي الگوريتم يادگيري ماشين در ابتدا به آماده‌سازي داده‌ها پرداخته و پس از آن آموزش مدل و تنظيم فراپارامتر‌ها صورت گرفت، سپس علاوه بر الگوريتم‌هاي يادگيري ماشين از دو الگوريتم جمعي جنگل‌تصادفي و درخت ‌فوق‌العاده تصادفي به عنوان الگوريتم‌هاي پايه براي ساخت مدل‌هاي يادگيري جمعي استفاده و پس از آموزش و تنظيم فراپارامترها، مدل نهايي با بهترين عملكرد انتخاب گرديد. سپس عملكرد الگوريتم‌هاي يادگيري جمعي و الگوريتم‌هاي يادگيري ماشين مورد بررسي قرار گرفت. مطابق انتظار اكثر الگوريتم‌هاي جمعي عملكرد بهتري نسبت به الگوريتم‌هاي پايه داشته‌اند‌. همچنين الگوريتم‌هاي فزون‌سازي گراديان فوق‌العاده (دقت 82٪)، فزون‌سازي تطبيقي (دقت 2/96٪) و پشته‌سازي (دقت 4/99٪) به ترتيب در مجموعه‌هاي اول تا سوم بهترين عملكرد‌ و ‌همچنين در مجموع سه الگوريتم رأي‌گيري، بقچه‌سازي و پشته‌سازي داراي عملكرد بهتري نسبت به ساير الگوريتم‌هاي جمعي در سه مجموعه داده داشته‌اند. سپس تأثير آنتي‌ژن اختصاصي پروستات بر روي دو مجموعه بررسي شد. كه با توجه به نتايج بدست‌ آمده آنتي‌ژن اختصاصي پروستات تأثير مثبتي بر مدل‌هاي پيش‌بيني داشته است. سرانجام با استفاده از قواعد انجمني به استخراج قواعدي مرتبط با شيوه زندگي از بيماران مبتلا به سرطان پروستات به منظور پيش‌آگاهي مورد بررسي قرار گرفت. پس از آماده‌سازي داده‌ها با استفاده از الگوريتم اپريوري و پشتيبان 1/0 الگو‌هاي مكرر استخراج و پس از آن قواعد انجمني با اطمينان 4/0 توليد گرديد. سپس قواعدي با عبارت تالي وجود سرطان پروستات به عنوان قواعد نهايي انتخاب شده‌اند. بهترين قواعد با پشتيبان 929/0 و خيزش 85/1، پشتيبان 643/0 و خيزش 353/1 به ترتيب در مجموعه داده‌هاي دوم و سوم معرفي گرديدند.
  • تاريخ ورود اطلاعات
    1404/04/09
  • عنوان به انگليسي
    Prostate cancer prediction based on machine learning models
  • تاريخ بهره برداري
    3/5/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    طه نخعي

  • چكيده به لاتين
    The rapid advancement of artificial intelligence (AI) an‎d the emergence of machine learning (ML) have profoundly influenced various industries, notably healthcare an‎d medicine. In particular, the integration of AI with medical technologies has enhanced capabilities in the diagnosis, prognosis, an‎d prediction of various cancers. Prostate cancer, one of the most common malignancies among men, often progresses asymptomatically in its early stages an‎d predominantly affects middle-aged an‎d elderly individuals, contributing significantly to cancer-related mortality. If malignant, the cancer may metastasize to other organs, such as the spine an‎d pelvis, often resulting in pain, bone fractures, an‎d motor impairments. This study proposes an ensemble learning-based model for the early prediction of prostate cancer using a classification approach. To achieve this, three datasets comprising clinical, imaging, lifestyle, an‎d demographic features were utilized, including data from both suspected an‎d confirmed prostate cancer cases. The modeling process involved comprehensive data preprocessing, model training, an‎d hyperparameter tuning. In addition to conventional ML algorithms, two ensemble methods, Ran‎dom Forest (RF) an‎d Extremely Ran‎domized Trees (ExtraTrees), were employed as base learners for ensemble construction. Following training, the best-performing models were selec‎ted based on classification accuracy. The results demonstrate that ensemble models consistently outperformed individual classifiers. Specifically, Extreme Gradient Boosting (XGBoost) achieved an accuracy of 82% on the first dataset, Adaptive Boosting (AdaBoost) reached 96.2% on the second dataset, an‎d Stacking achieved 99.4% accuracy on the third dataset. Moreover, the ensemble methods of voting, bagging, an‎d stacking showed superior overall performance across all datasets. The influence of prostate-specific antigen (PSA) was also analyzed, revealing a positive effect on predictive performance. Furthermore, association rule mining was applied to identify lifestyle-related patterns associated with prostate cancer. Using the Apriori algorithm with a minimum support of 0.1 an‎d a minimum confidence of 0.4, frequent patterns an‎d association rules were extracted. Final rules indicating prostate cancer presence in the consequent were selec‎ted, with the most significant rules achieving a support of 0.929 an‎d a lift of 1.85 in the second dataset, an‎d a support of 0.643 an‎d a lift of 1.353 in the third dataset.
  • كليدواژه هاي فارسي
    سرطان پروستات , يادگيري ماشين , يادگيري جمعي , قواعد انجمني
  • كليدواژه هاي لاتين
    Prostate Cancer , Machine Learning , Ensemble Learning , Association Rules
  • Author
    Taha Nakhaei
  • SuperVisor
    Mohammad Fathian