-
شماره ركورد
31667
-
پديد آورنده
مهدي علي محمدي
-
عنوان
پيش بيني نرخ مرگ و مير و ابتلا به سرطان با استفاده از الگوريتم هاي يادگيري ماشين: مطالعه موردي كوهورت گلستان
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع- بهينهسازي سيستمها
-
سال تحصيل
1400
-
تاريخ دفاع
1403/06/26
-
استاد راهنما
دكتر قوسي - دكتر عليها
-
استاد مشاور
دكتر آتشي
-
دانشكده
مهندسي صنايع
-
چكيده
سرطان همچنان يكي از علل اصلي مرگ و مير جهاني به شمار ميرود و تأثير قابل توجهي بر سلامت عمومي دارد و نياز به مدلهاي پيشبيني مؤثر را برجسته ميكند. با وجود پيشرفتهاي مداوم در شناسايي نشانههاي اوليه و توسعه درمانها، نرخهاي بالاي مرگ و مير همچنان پايدار است. اين مطالعه به بررسي كارايي الگوريتمهاي مختلف يادگيري ماشين در پيشبيني مرگ و مير و بروز سرطان ميپردازد و به اين سؤال پاسخ ميدهد: آيا يك مدل يادگيري جمعي ميتواند دقت پيشبيني را در مقايسه با مدلهاي سادهتر بهبود بخشد؟ مسئله تحقيق بر بهينهسازي عملكرد مدل با در نظر گرفتن زمان اجرا و پيچيدگي متمركز است. يك تحليل مقايسهاي با استفاده از مجموعهاي از الگوريتمها، از جمله درختان تصميم، نزديكترين همسايهها، رگرسيون لجستيك، ماشينهاي بردار پشتيبان، بيزين ساده، شبكههاي عصبي، جنگلهاي تصادفي، گراديان تقويتي و درختان تقويت كننده گراديان انجام شد. اين مطالعه اين مدلها را به عنوان يادگيرندههاي پايه و متا ارزيابي كرد تا معيارهاي عملكرد، از جمله دقت را بررسي كند. مدل يادگيري جمعي توسعهيافته جديد، دقت 87.45٪ را در پيشبيني نرخهاي مرگ و مير به دست آورد كه كمي بيشتر از 87.43٪ درختان تقويت گراديان بود. با اين حال، افزايش دقت نسبت به پيچيدگي اضافه شده و زمان اجراي طولانيتر مدل يادگيري جمعي ناچيز بود و اين موضوع نشان ميدهد كه مدلهاي سادهتر ممكن است نتايج قابل اعتماد را به طور كارآمدتري ارائه دهند. در پيشبيني بروز سرطان، مدل يادگيري جمعي عملكرد ضعيفتري نسبت به مدلهاي پايه متعارف نشان داد و علائم بيشبرازش را از خود بروز داد كه احتمالاً به دادههاي نامتعادل نسبت داده ميشود. يافتهها نشان ميدهند كه در حالي كه مدلهاي پيشرفته مانند مدل يادگيري جمعي ميتوانند در برخي زمينهها بهبودهاي جزئي را ارائه دهند، ممكن است توجيه كافي براي پيچيدگي آنها فراهم نكنند. اين تحقيق از استفاده از مدلهاي سادهتر براي دستيابي به نتايج قابل اعتماد به روشي زمانكارآمد حمايت ميكند و بر لزوم بررسي بيشتر در خصوص پرداختن به عدم تعادل دادهها در پيشبيني بروز سرطان تأكيد ميورزد.
-
تاريخ ورود اطلاعات
1403/09/05
-
عنوان به انگليسي
Mortality rates and cancer incidence prediction using machine learning algorithms: A case study of Golestan cohort
-
تاريخ بهره برداري
9/16/2025 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مهدي علي محمدي
-
چكيده به لاتين
Cancer remains one of the leading causes of global mortality, significantly impacting public health and underscoring the need for effective predictive models. Despite ongoing advancements in identifying early signs and developing treatments, high mortality rates persist. This study investigates the effectiveness of various machine learning algorithms in predicting cancer mortality and incidence, addressing the question: Can a stacking model improve predictive accuracy over traditional models? The research problem focuses on optimizing model performance while considering execution time and complexity. A comparative analysis was conducted using a range of algorithms, including decision trees, k-nearest neighbors, logistic regression, support vector machines, naive Bayes, neural networks, random forests, gradient boosting, and gradient-boosting trees. The study evaluated these models as base and meta-learners to assess performance metrics, including accuracy and execution time. The newly developed stacking model achieved an accuracy of 87.45% in predicting mortality rates, slightly surpassing the 87.43% of gradient-boosting trees. However, the increase in accuracy was minimal relative to the added complexity and longer execution time of the stacking model, suggesting that simpler models may yield more reliable results efficiently. In predicting cancer incidence, the stacking model demonstrated poorer performance compared to conventional base models and exhibited signs of overfitting, likely attributed to imbalanced data. The findings indicate that while advanced models like the stacking model can offer slight improvements in certain contexts, they may not provide sufficient justification for their complexity. This research advocates for the use of simpler models to achieve reliable outcomes in a more time-efficient manner and highlights the need for further investigation into addressing data imbalances in cancer incidence prediction.
-
كليدواژه هاي فارسي
پيش بيني مرگ , پيشبيني ابتلاء به سرطان , يادگيري ماشين , طبقه بندي , كوهورت
-
كليدواژه هاي لاتين
Mortality prediction , Cancer incidence prediction , Machine Learning , Classification , Cohort
-
Author
Mahdi Alimohammadi
-
SuperVisor
Dr. Ghousi - Dr. Aliha
-
لينک به اين مدرک :