شماره ركورد
33499
پديد آورنده
تينا جاويدي پور
عنوان
ارائه يك رويكرد تحليلي به منظور استفاده و مقايسه عملكرد الگوريتمهاي يادگيري تركيبي براي پيشبيني و تشخيص بيماريها و شناسايي مهمترين عوامل خطر
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي صنايع
سال تحصيل
1401
تاريخ دفاع
13/03/1404
استاد راهنما
دكتر عبدالرحمن حائري
استاد مشاور
ندارم
دانشكده
مهندسي صنايع
چكيده
در دهههاي اخير، رشد فزاينده شيوع سندروم متابوليك به يكي از چالشهاي نظامهاي سلامت جهان بدل شده است. بار اقتصادي و باليني اين سندروم سالانه هزينههاي مستقيم و غيرمستقيم هنگفتي بر دولتها و بيماران تحميل ميكند. در سالهاي اخير، بهرهگيري از الگوريتمهاي يادگيري ماشين در حوزه سلامت و بهداشت عمومي، بهويژه در زمينه پيشبيني و تشخيص بيماريها، مورد توجه گستردهاي قرار گرفته است. هدف اصلي اين پژوهش پيشبيني سندروم متابوليك در افراد با ارائه يك رويكرد تحليلي مبتني بر روش CRISP-DM (فرآيند استاندارد صنعتي براي دادهكاوي) به منظور استفاده از الگوريتمهاي يادگيري تركيبي و مقايسه عملكرد آنها براي پيشبيني و تشخيص سندروم متابوليك و شناسايي مهمترين عوامل خطر است. براي انجام اين مطالعه، از يك مجموعه داده متعلق به جمعيت ايالات متحده استفاده شدكه علاوه بر نتايج آزمايشگاهي و اندازهگيريهاي باليني شامل اطلاعات جمعيت شناسي (جنسيت، نژاد، وضعيت تأهل و درآمد) بود. پس از انجام مراحل پيشپردازش دادهها، پيادهسازي الگوريتمهاي يادگيري ماشين انفرادي و تركيبي، تنظيم پارامترهاي بهينه با استفاده از روش جستوجوي تصادفي با اعتبارسنجي متقاطع (RandomizedSearchCV) و ارزيابي عملكرد الگوريتمها، نتايج نشان داد كه الگوريتم تركيبي گراديان بوستينگ (Gradient Boosting) با دقت 92.6 درصد، بهترين عملكرد را در پيشبيني سندروم متابوليك داشته و نسبت به نتايج مطرحشده در مطالعات پيشين به ميزان 3.29 درصد بهبود نشان داده است. تحليل اهميت ويژگيها با نمودار مقادير شپلي (SHAP) نشان داد كه مهمترين عوامل خطر در ابتلا به سندروم متابوليك سطح بالاي قند خون، تري گليسيريد، اندازه دور كمر (چاقي شكمي) و سطح پايين كلسترول HDL بودند. عواملي مانند نسبت آلبومين به كراتينين ادرار، سن، جنسيت و درآمد نيز نقش تعيينكنندهاي داشتند. در بخش تحليل توصيفي نيز گروههاي پرخطر شناسايي شده و نقش بالقوه متغيرهاي جمعيتشناختي، وضعيت سلامت روان و الگوهاي غذايي غالب در زيرگروههاي مختلف، در شكلگيري بيماري مورد بررسي اجمالي قرار گرفت. يافتههاي اين پژوهش نه تنها امكان پيشبيني دقيقتر سندروم متابوليك و شناسايي گروههاي پرخطر را فراهم كرده، بلكه در بهبود راهبردها و سياستگذاريهاي پيشگيرانه، تشخيص زودهنگام و بهينهسازي منابع نظام سلامت به بيماران، دولتها و سازمانهاي سلامت كمك ميكند. تشخيص زودهنگام سندروم متابوليك ميتواند از بروز بيماريهاي قلبي-عروقي، ديابت و نارسايي كليوي جلوگيري كند، منجر به كاهش نرخ بستري و هزينههاي درماني بلندمدت شود، و منابع مالي نظام سلامت را بهينهتر مديريت كند.
تاريخ ورود اطلاعات
1404/04/23
عنوان به انگليسي
Presenting an Analytical Approach to Use and Compare the performance of Ensemble learning Algorithms in order to Predict and Diagnose Diseases and Identify the most important Risk Factors
تاريخ بهره برداري
6/3/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
تينا جاويدي پور
چكيده به لاتين
In recent decades, the increasing prevalence of metabolic syndrome has become a challenge for global health systems. The economic and clinical burden of this syndrome imposes huge direct and indirect costs on governments and patients annually. In recent years, the application of machine learning algorithms in the field of public health particularly for the prediction and diagnosis of diseases has garnered significant attention. The primary objective of this study is to predict metabolic syndrome in individuals by presenting an analytical approach based on the CRISP-DM methodology (Cross-Industry Standard Process for Data Mining), utilizing ensemble learning algorithms and comparing their performance in predicting and diagnosing metabolic syndrome as well as identifying the most important risk factors.
To conduct this research, a dataset representing the U.S. population was employed, which included not only laboratory and clinical measurements but also demographic information (such as sex, race, marital status, and income). Following the data preprocessing phase, the implementation of individual and ensemble machine learning algorithms, and the tuning of optimal parameters through Randomized Search, the results indicated that the Gradient Boosting ensemble algorithm achieved the highest predictive performance with an accuracy of 92.6%, surpassing the results reported in previous studies by 3.2%.
Feature importance analysis revealed that the most influential risk factors for developing metabolic syndrome were elevated blood glucose levels, high triglycerides, increased waist circumference (abdominal obesity), and low HDL cholesterol. Additionally, variables such as the urine albumin-to-creatinine ratio, age, sex, and income also played a significant role. In the descriptive analysis section, high-risk groups were identified, and the potential influence of demographic variables, mental health status, and predominant dietary patterns across different subpopulations on disease development was briefly explored.
The findings of this research not only enable more accurate prediction of metabolic syndrome and identification of high-risk groups but also contribute to enhancing preventive strategies, facilitating early diagnosis, and optimizing healthcare system resources to benefit patients, governments, and public health organizations. Early diagnosis of metabolic syndrome can prevent the occurrence of cardiovascular diseases, diabetes, and kidney failure, lead to reduced hospitalization rates and long-term medical costs, and manage the health systemʹs financial resources more efficiently.
كليدواژه هاي فارسي
داده كاوي , يادگيري ماشين , سندروم متابوليك , يادگيري تركيبي , پيشبيني و تشخيص بيماري , طبقه بندي
كليدواژه هاي لاتين
Data mining , Machine Learning , Metabolic Syndrome , Ensemble Learning , Disease Diagnosis and Prediction , Classification
Author
Tina Javidipour
SuperVisor
Dr. Abdorrahman Haeri