• شماره ركورد
    33499
  • پديد آورنده

    تينا جاويدي پور

  • عنوان
    ارائه يك رويكرد تحليلي به منظور استفاده و مقايسه عملكرد الگوريتم‌هاي يادگيري تركيبي براي پيش‌بيني و تشخيص بيماري‌ها و شناسايي مهم‌ترين عوامل خطر
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي صنايع
  • سال تحصيل
    1401
  • تاريخ دفاع
    13/03/1404
  • استاد راهنما
    دكتر عبدالرحمن حائري
  • استاد مشاور
    ندارم
  • دانشكده
    مهندسي صنايع
  • چكيده
    در دهه‌هاي اخير، رشد فزاينده شيوع سندروم متابوليك به يكي از چالش‌هاي نظام‌هاي سلامت جهان بدل شده است. بار اقتصادي و باليني اين سندروم سالانه هزينه‌هاي مستقيم و غيرمستقيم هنگفتي بر دولت‌ها و بيماران تحميل مي‌كند. در سال‌هاي اخير، بهره‌گيري از الگوريتم‌هاي يادگيري ماشين در حوزه سلامت و بهداشت عمومي، به‌ويژه در زمينه پيش‌بيني و تشخيص بيماري‌ها، مورد توجه گسترده‌اي قرار گرفته است. هدف اصلي اين پژوهش پيش‌بيني سندروم متابوليك در افراد با ارائه يك رويكرد تحليلي مبتني بر روش CRISP-DM (فرآيند استاندارد صنعتي براي داده‌كاوي) به منظور استفاده از الگوريتم‌هاي يادگيري تركيبي و مقايسه عملكرد آن‌ها براي پيش‌بيني و تشخيص سندروم متابوليك و شناسايي مهم‌ترين عوامل خطر است. براي انجام اين مطالعه، از يك مجموعه داده متعلق به جمعيت ايالات متحده استفاده شدكه علاوه بر نتايج آزمايشگاهي و اندازه‌گيري‌هاي باليني شامل اطلاعات جمعيت شناسي (جنسيت، نژاد، وضعيت تأهل و درآمد) بود. پس از انجام مراحل پيش‌پردازش داده‌ها، پياده‌سازي الگوريتم‌هاي يادگيري ماشين انفرادي و تركيبي، تنظيم پارامترهاي بهينه با استفاده از روش جست‌وجوي تصادفي با اعتبارسنجي متقاطع (RandomizedSearchCV) و ارزيابي عملكرد الگوريتم‌ها، نتايج نشان داد كه الگوريتم تركيبي گراديان بوستينگ (Gradient Boosting) با دقت 92.6 درصد، بهترين عملكرد را در پيش‌بيني سندروم متابوليك داشته و نسبت به نتايج مطرح‌شده در مطالعات پيشين به ميزان 3.29 درصد بهبود نشان داده است. تحليل اهميت ويژگي‌ها با نمودار مقادير شپلي (SHAP) نشان داد كه مهم‌ترين عوامل خطر در ابتلا به سندروم متابوليك سطح بالاي قند خون، تري گليسيريد، اندازه دور كمر (چاقي شكمي) و سطح پايين كلسترول HDL بودند. عواملي مانند نسبت آلبومين به كراتينين ادرار، سن، جنسيت و درآمد نيز نقش تعيين‌كننده‌اي داشتند. در بخش تحليل توصيفي نيز گروه‌هاي پرخطر شناسايي شده و نقش بالقوه متغيرهاي جمعيت‌شناختي، وضعيت سلامت روان و الگوهاي غذايي غالب در زيرگروه‌هاي مختلف، در شكل‌گيري بيماري مورد بررسي اجمالي قرار گرفت. يافته‌هاي اين پژوهش نه تنها امكان پيش‌بيني دقيق‌تر سندروم متابوليك و شناسايي گروه‌هاي پرخطر را فراهم كرده، بلكه در بهبود راهبردها و سياست‌گذاري‌هاي پيشگيرانه، تشخيص زودهنگام و بهينه‌سازي منابع نظام سلامت به بيماران، دولت‌ها و سازمان‌هاي سلامت كمك مي‌كند. تشخيص زودهنگام سندروم متابوليك مي‌تواند از بروز بيماري‌هاي قلبي-عروقي، ديابت و نارسايي كليوي جلوگيري كند، منجر به كاهش نرخ بستري و هزينه‌هاي درماني بلندمدت شود، و منابع مالي نظام سلامت را بهينه‌تر مديريت كند.
  • تاريخ ورود اطلاعات
    1404/04/23
  • عنوان به انگليسي
    Presenting an Analytical Approach to Use an‎d Compare the performance of Ensemble learning Algorithms in order to Predict an‎d Diagnose Diseases an‎d Identify the most important Risk Factors
  • تاريخ بهره برداري
    6/3/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    تينا جاويدي پور

  • چكيده به لاتين
    In recent decades, the increasing preva‎lence of metabolic syndrome has become a challenge for global health systems. The economic an‎d clinical burden of this syndrome imposes huge direct an‎d indirect costs on governments an‎d patients annually. In recent years, the application of machine learning algorithms in the field of public health particularly for the prediction an‎d diagnosis of diseases has garnered significant attention. The primary objective of this study is to predict metabolic syndrome in individuals by presenting an analytical approach based on the CRISP-DM methodology (Cross-Industry Stan‎dard Process for Data Mining), utilizing ensemble learning algorithms an‎d comparing their performance in predicting an‎d diagnosing metabolic syndrome as well as identifying the most important risk factors. To conduct this research, a dataset representing the U.S. population was employed, which included not only laboratory an‎d clinical measurements but also demographic information (such as sex, race, marital status, an‎d income). Following the data preprocessing phase, the implementation of individual an‎d ensemble machine learning algorithms, an‎d the tuning of optimal parameters through Ran‎domized Search, the results indicated that the Gradient Boosting ensemble algorithm achieved the highest predictive performance with an accuracy of 92.6%, surpassing the results reported in previous studies by 3.2%. Feature importance analysis revealed that the most influential risk factors for developing metabolic syndrome were elevated blood glucose levels, high triglycerides, increased waist circumference (abdominal obesity), an‎d low HDL cholesterol. Additionally, variables such as the urine albumin-to-creatinine ratio, age, sex, an‎d income also played a significant role. In the descriptive analysis section, high-risk groups were identified, an‎d the potential influence of demographic variables, mental health status, an‎d predominant dietary patterns across different subpopulations on disease development was briefly explored. The findings of this research not only enable more accurate prediction of metabolic syndrome an‎d identification of high-risk groups but also contribute to enhancing preventive strategies, facilitating early diagnosis, an‎d optimizing healthcare system resources to benefit patients, governments, an‎d public health organizations. Early diagnosis of metabolic syndrome can prevent the occurrence of cardiovascular diseases, diabetes, an‎d kidney failure, lead to reduced hospitalization rates an‎d long-term medical costs, an‎d manage the health systemʹs financial resources more efficiently.
  • كليدواژه هاي فارسي
    داده كاوي , يادگيري ماشين , سندروم متابوليك , يادگيري تركيبي , پيش‌بيني و تشخيص بيماري , طبقه بندي
  • كليدواژه هاي لاتين
    Data mining , Machine Learning , Metabolic Syndrome , Ensemble Learning , Disease Diagnosis an‎d Prediction , Classification
  • Author
    Tina Javidipour
  • SuperVisor
    Dr. Abdorrahman Haeri