-
شماره ركورد
26710
-
پديد آورنده
مهرنوش غظنفري هرندي
-
عنوان
توسعه رويكردي مبتني بر علم داده براي پيش بيني مدت زمان بستري مبتلايان به كرونا با پيشينه بيماري هاي مختلف ( مطالعه موردي: بيماران بيمارستان امام خميني)
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع - بهينه سازي سيستم ها
-
سال تحصيل
1398
-
تاريخ دفاع
1401/03/17
-
استاد راهنما
دكتر رسول نورالسناء
-
دانشكده
مهندسي صنايع
-
چكيده
گسترش سريع كوويد-19 به دليل افزايش حجم پرونده در هر بيمارستان، چالش مهمي را براي سيستم هاي مراقبت هاي بهداشتي و به طور خاص براي بيمارستان ها ايجاد كرده است. از آنجايي كه تقاضاي تخت بيمارستان به شدت به طول مدت اقامت بيماران مبتلا به كوويد-19 بستگي دارد، كشف نشانگرهاي زيستي اوليه مدت زمان بستري ممكن است تخصيص منابع بيمارستان را از زمان دسترسي به بخش اورژانس منطقي كند و درمان مناسب را تسهيل كند و نتايج درمان بيماران را بهبود بخشد. بنابراين وجود يك مدل آماري پيش بيني كننده براي يافتن هرچه دقيق تر تعداد روزهاي بستري بيماران كرونايي، از اهميت بالايي برخوردار است. هدف از اين پژوهش، پيش بيني مدت زمان بستري بيماران مبتلا به كوويد-19 در بيمارستان به كمك ابزارهاي آماري، تكنيك هاي داده كاوي و يادگيري ماشين با توجه به جايگزيني داده هاي گمشده و انتخاب ويژگي هاي موثر در پيش بيني مي باشد. از اين رو عملكرد 5 الگوريتم رگرسيون به نام هاي رگرسيون جنگل تصادفي، رگرسيون بردار پشتيبان، رگرسيون تقويت گراديان شديد، رگرسيون تقويت گراديان و رگرسيون شبكه عصبي مصنوعي با توجه به سه معيار ارزيابي عملكرد ضريب تعيين، جذر ميانگين مربع خطاها و ميانگين خطاي مطلق باهم مقايسه شد. همچنين براي پركردن داده هاي گمشده از چهار روش تطبيق ميانگين پيش بيني كننده، جنگل تصادفي، درخت رگرسيون و طبقه بندي و تطبيق ميانگين پيشبينيكننده با انتخاب اهداكنندگان به كمك فاصله استفاده شد كه با توجه به مقدار خطاي محاسبه شده براي هر روش، روش جنگل تصادفي به عنوان بهترين روش براي پر كردن داده هاي گمشده انتخاب شد و از بين چهار روش رگرسيون لاسو، رگرسيون تيغه اي، رگرسيون شبكه الاستيك و حذف ويژگي بازگشتي، روش حذف ويژگي بازگشتي به عنوان روش برتر انتخاب ويژگي شناسايي شد. مطالعه موردي اين پژوهش، بررسي داده هاي 659 بيمار مبتلا به كوويد-19 كه از بيمارستان امام خميني تهران از اواسط ماه اسفند سال 1398 الي اوايل ماه ارديبهشت سال 1399 جمع آوري شده است مي باشد. از بين مدل هاي معرفي شده براي پيش بيني، رگرسيون تقويت گراديان بهترين عملكرد را از منظر معيارهاي ارزيابي، براي پيش بيني مدت زمان بستري بيماران مبتلا به كوويد-19 داشته است، كه با توجه به نتايج به دست آمده از اين مدل، سن بيمار، تب، ساير علائم، سردرد، تنگي نفس و خلط خوني متغيرهاي تاثيرگذار در پيش بيني مدت زمان بستري بيماران كرونايي در بيمارستان به دست آمدند.
-
تاريخ ورود اطلاعات
1401/04/15
-
عنوان به انگليسي
Developing a Data Science Approach to Predict the Length of Hospitalization for Covid-19 Patients with Pre-existing Conditions (Case Study: Iman Khomaini Hospital Patients)
-
تاريخ بهره برداري
6/7/2023 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
مهرنوش غظنفري هرندي
-
چكيده به لاتين
The rapid growth of COVID-19 has posed significant challenges to health care systems, and hospitals in particular, due to the increasing number of cases in each institution. In view of the fact that the demand for hospital beds is highly dependent on the length of stay of patients with COVID-19, the discovery of early biomarkers of the length of hospital stay may rationalize allocation of hospital resources from access to the emergency department and facilitate appropriate treatment and improvement of patient care. Therefore, the development of a statistical model to predict the length of stay at hospital for patients with COVID-19 is essential. The aim of this study was to determine the length of stay of COVID-19 patients in the hospital with statistical tools, data mining techniques, and machine learning, in regard to the imputation of missing data and feature selection. Thus, five regression algorithms-Random Forest Regression, Support Vector Regression, XGBoost Regression, Gradient Boosting Regression, and Artificial Neural Network Regression-were compared based on the evaluation criteria. In addition, to fill in the missing data, four methods were used: Predictive mean matching (PMM), Predictive Mean Matching with distance-aided donor selection (Midastouch), Classification and Regression Tree (CART), and Random Forest. According to the amount of error calculated for each method, the Random Forest method Was selected as the best way to fill in the missing data. Among the four methods of Lasso Regression, Ridge Regression, Elastic net Regression and Recursive Feature Elimination (RFE) that were used to feature selection, the Recursive Feature Elimination (RFE) method was selected to choose the most effective features. The case of this study is the data of 659 patients with COVID-19 collected from Imam Khomeini Hospital in Tehran from mid-March 2021 to early May 2021. Among the models introduced for prediction, Gradient Boosting Regression had the best performance in terms of evaluation criteria to predict the length of stay of patients with COVID-19 at the hospital, which according to the results of this model, age, fever, other symptoms, headache, dyspnea and hemoptysis were effective variables in predicting the length of hospital stay of coronary patients.
-
كليدواژه هاي فارسي
كوويد-19 , مدت زمان بستري , پيش بيني , يادگيري ماشين , رگرسيون , داده هاي گمشده
-
كليدواژه هاي لاتين
COVID-19 , length of stay , prediction , machine learning , regression , missing data
-
Author
Mehrnoush Ghazanfariharandi
-
SuperVisor
Rassoul Noorossana
-
لينک به اين مدرک :