مهدي علي محمدي

عنوان

پيش بيني نرخ مرگ و مير و ابتلا به سرطان با استفاده از الگوريتم هاي يادگيري ماشين: مطالعه موردي كوهورت گلستان

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي صنايع- بهينه‌سازي سيستم‌ها

سال تحصيل

1400

تاريخ دفاع

1403/06/26

استاد راهنما

دكتر قوسي - دكتر عليها

استاد مشاور

دكتر آتشي

دانشكده

مهندسي صنايع

چكيده

سرطان همچنان يكي از علل اصلي مرگ و مير جهاني به شمار مي‌رود و تأثير قابل توجهي بر سلامت عمومي دارد و نياز به مدل‌هاي پيش‌بيني مؤثر را برجسته مي‌كند. با وجود پيشرفت‌هاي مداوم در شناسايي نشانه‌هاي اوليه و توسعه درمان‌ها، نرخ‌هاي بالاي مرگ و مير همچنان پايدار است. اين مطالعه به بررسي كارايي الگوريتم‌هاي مختلف يادگيري ماشين در پيش‌بيني مرگ و مير و بروز سرطان مي‌پردازد و به اين سؤال پاسخ مي‌دهد: آيا يك مدل يادگيري جمعي مي‌تواند دقت پيش‌بيني را در مقايسه با مدل‌هاي ساده‌تر بهبود بخشد؟ مسئله تحقيق بر بهينه‌سازي عملكرد مدل با در نظر گرفتن زمان اجرا و پيچيدگي متمركز است. يك تحليل مقايسه‌اي با استفاده از مجموعه‌اي از الگوريتم‌ها، از جمله درختان تصميم، نزديك‌ترين همسايه‌ها، رگرسيون لجستيك، ماشين‌هاي بردار پشتيبان، بيزين ساده، شبكه‌هاي عصبي، جنگل‌هاي تصادفي، گراديان تقويتي و درختان تقويت كننده گراديان انجام شد. اين مطالعه اين مدل‌ها را به عنوان يادگيرنده‌هاي پايه و متا ارزيابي كرد تا معيارهاي عملكرد، از جمله دقت را بررسي كند. مدل يادگيري جمعي توسعه‌يافته جديد، دقت 87.45٪ را در پيش‌بيني نرخ‌هاي مرگ و مير به دست آورد كه كمي بيشتر از 87.43٪ درختان تقويت گراديان بود. با اين حال، افزايش دقت نسبت به پيچيدگي اضافه شده و زمان اجراي طولاني‌تر مدل يادگيري جمعي ناچيز بود و اين موضوع نشان مي‌دهد كه مدل‌هاي ساده‌تر ممكن است نتايج قابل اعتماد را به طور كارآمدتري ارائه دهند. در پيش‌بيني بروز سرطان، مدل يادگيري جمعي عملكرد ضعيف‌تري نسبت به مدل‌هاي پايه متعارف نشان داد و علائم بيش‌برازش را از خود بروز داد كه احتمالاً به داده‌هاي نامتعادل نسبت داده مي‌شود. يافته‌ها نشان مي‌دهند كه در حالي كه مدل‌هاي پيشرفته مانند مدل يادگيري جمعي مي‌توانند در برخي زمينه‌ها بهبودهاي جزئي را ارائه دهند، ممكن است توجيه كافي براي پيچيدگي آن‌ها فراهم نكنند. اين تحقيق از استفاده از مدل‌هاي ساده‌تر براي دستيابي به نتايج قابل اعتماد به روشي زمان‌كارآمد حمايت مي‌كند و بر لزوم بررسي بيشتر در خصوص پرداختن به عدم تعادل داده‌ها در پيش‌بيني بروز سرطان تأكيد مي‌ورزد.

تاريخ ورود اطلاعات

1403/09/05

عنوان به انگليسي

Mortality rates and cancer incidence prediction using machine learning algorithms: A case study of Golestan cohort

تاريخ بهره برداري

9/16/2025 12:00:00 AM

دانشجوي وارد كننده اطلاعات

مهدي علي محمدي

Name: مهدي علي محمدي
Author: مهدي علي محمدي

چكيده به لاتين

Cancer remains one of the leading causes of global mortality, significantly impacting public health and underscoring the need for effective predictive models. Despite ongoing advancements in identifying early signs and developing treatments, high mortality rates persist. This study investigates the effectiveness of various machine learning algorithms in predicting cancer mortality and incidence, addressing the question: Can a stacking model improve predictive accuracy over traditional models? The research problem focuses on optimizing model performance while considering execution time and complexity. A comparative analysis was conducted using a range of algorithms, including decision trees, k-nearest neighbors, logistic regression, support vector machines, naive Bayes, neural networks, random forests, gradient boosting, and gradient-boosting trees. The study eva‎luated these models as base and meta-learners to assess performance metrics, including accuracy and execution time. The newly developed stacking model achieved an accuracy of 87.45% in predicting mortality rates, slightly surpassing the 87.43% of gradient-boosting trees. However, the increase in accuracy was minimal relative to the added complexity and longer execution time of the stacking model, suggesting that simpler models may yield more reliable results efficiently. In predicting cancer incidence, the stacking model demonstrated poorer performance compared to conventional base models and exhibited signs of overfitting, likely attributed to imbalanced data. The findings indicate that while advanced models like the stacking model can offer slight improvements in certain contexts, they may not provide sufficient justification for their complexity. This research advocates for the use of simpler models to achieve reliable outcomes in a more time-efficient manner and highlights the need for further investigation into addressing data imbalances in cancer incidence prediction.

كليدواژه هاي فارسي

پيش بيني مرگ , پيش‌بيني ابتلاء به سرطان , يادگيري ماشين , طبقه بندي , كوهورت

كليدواژه هاي لاتين

Mortality prediction , Cancer incidence prediction , Machine Learning , Classification , Cohort

Author

Mahdi Alimohammadi

SuperVisor

Dr. Ghousi - Dr. Aliha

لينک به اين مدرک

https://dl.iust.ac.ir/dl/search/default.aspx?Term=31667&Field=0&DTC=6