-
شماره ركورد
25205
-
پديد آورنده
آرمان قويدل
-
عنوان
كشف الگوهاي پزشكي و ارائه يك سيستم پبش بيني كننده ي احتمال مرگ و مير بيمار در آي سي يو جراحي قلب با رويكرد داده كاوي تركيب ي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع
-
سال تحصيل
97
-
تاريخ دفاع
1400/4/23
-
استاد راهنما
دكتر روزبه قوسي
-
استاد مشاور
دكتر عليرضا آتشي
-
دانشكده
صنايع
-
چكيده
صنعت سلامت به طور مستمر در حال توليد ميزان زيادي از دادهها مي باشد و افرادي كه با اين نوع دادهها
مواجه هستند،دريافتهاند كه بين جمعآوري تا تفسيرآنها شكاف وسيعي وجود دارد، حوزهي به نسبت جوان
و درحال رشد داد هكاوي در سلامت از جمله شيوههايي است كه م يتواند اين صنعت را از تحليل عميق اين
دادهها بهرهمند سازد و به توسعهي تحقيقات پزشكي و تصميمگيريها ي علمي در زمينهي تشخيص و
درمان منتج شود. ازآن جايي كه موثرترين روش براي كاهش مرگ ومير ناشي از بيماريها،تشخيص بهموقع
آن است،چراكه ضمن كاهش هزينه ها،شانس درمان موفقيت آميزبيمار را افزايش مي دهد.باتوجه به اين كه
درحال حاضر دركشور ما روزانه حجم وسيعي ازدادهها طي فراين دهاي مراقبت و درمان بيماران حاصل مي-
شود،اما تحليل و تفسيرآنها باهدف كشف الگو و دانش جديدي كه بتواند منتج به ارتقاي سلامت شودكم-
رنگ است، درنتيجه دادهكاوي ويادگيري ماشين در حوزه بيماريها،فرصتهاي مناسبي را براي بررسي
الگوهاي پنهان اين مجموعه فراهم م يكند تا اين الگوها با كمك پزشكان براي تعيين بيماري و تشخيص و
درمان آن مور د استفاده قرار گيرد . اين پژوهش به معرفي يك مدل پيشبيني داد هكاوي جديد براساس روش
تركيبي انباشتهسازي دادههاي نامتوازن براي بيماران پس ازجراحي قلب ميپردازد.استفاده از دادههاي
نامتوازن منجر به پيشبينيهاي غيرقابل قبول ميشود،بنابراين براي متوازن ساختن دادهها ازتركيب يكي از
الگوريتمهاي نمونهافزاي ي به نام اسموت با الگوريتم نمونهكاهي نزديكترين همساي هي اصلاحشد ه استفاده
شدهاست. علاوه براين اين پژوهش ازالگوريتم جنگل تصادفي براي تعيين ويژگيهاي مهم و ميزان
تاثيرهركدام استفاده ميكند . به منظور اعتبارسنجي عملكرد اجراي مدلهاي پيادهسازي شده در اين
تحقيق، اين پژوهش ازدو روش اعتبارسنجي ساده و زيرمجموعهاي استفاده كرده است. لازم به ذكر است كه
مدل جديد همراه با مدلهاي مختلف دادهكاوي از جمله رگرسيون لجستيك ، نزديكترين همسايه ، ماشين
بردار پشتيباني ، بيز ساده ، شبكه عصبي مصنوعي ، درخت تصميم ، گراديان تقويتي ، درخت كيسه اي و
جنگل تصادفي مقايسه ميشود. نتايج نشان ميدهد كه مدل جديد معرفي شده در اين پژوهش ، بهترين
عملكرد پيشبيني وضعيت حيات بيماران را در ميان ساير مدلهاي اجرا شده دارد. همچنين آزمون آماري
فريدمن جهت بررسي تفاوت معناداري بين مدلهاي پيشبيني و تعيين بهترين مدل از نظر عملكرد مورد
استفاده قرار گرفتهاست. نتايج آزمون فريدمن ثابت م يكند كه مدل جديد معرفي شده نسبت به ساير مدلها
موثرتر ميباشد. مشخص كردن تاثير ويژگيها در پيشبيني مدلها يكي ديگر از اهداف اين پژوهش بوده-
است. از نتايج حاصل ميتوان به بهبود عملكرد مدل پس از حذف ويژگيهاي كم اهميت اشاره كرد .
-
تاريخ ورود اطلاعات
1400/06/24
-
عنوان به انگليسي
Discovering medical patterns and providing a system for predicting the mortality of a patient in the ICU of cardiac surgery with an ensemble data mining approach
-
تاريخ بهره برداري
7/14/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
ارمان قويدل
-
چكيده به لاتين
According to the spectacular progress of biomedical and health care level, a massive amount of data has been collected for analysis. In addition, the most effective approach to reduce disease mortality is to diagnose it as soon as possible. As a result, data mining with application of machine learning in the field of diseases provides good opportunities to examine the hidden patterns of this collection. An exact forecast of the mortality after a heart surgery will cause less costs and Successful treatment of the patient. This paper intends to introduce a new stacking predictive model after using random forest as a feature selection method to foresee the mortality after a heart surgery on a highly imbalanced dataset. To solve the imbalanced data problem, a combination of SVM-SMOTE over-sampling algorithm and Edited-Nearest-Neighbor under-sampling algorithm is used. This research compares introduced model with some other machine learning classifiers to ensure the efficiency through shuffle hold-out and ten-fold cross-validation strategies. In order to validate the performance of the implemented models in this research, both shuffle hold-out and ten-fold cross-validation results indicated that our model had the highest efficiency compared to the other models. Furthermore, the Friedman statistical test is applied to survey the differences between models. The result demonstrates that the proposed model is more effective than other classifiers.
-
كليدواژه هاي فارسي
دادهكاوي،يادگيري ماشين،رو شهاي گروهي،جراحي قلب
-
كليدواژه هاي لاتين
Classification, hybrid predictive model, stacking ensemble method, heart surgery, imbalanced data problem, machine learning in healthcare, SVM-SMOTE method, Friedman test
-
لينک به اين مدرک :