-
شماره ركورد
33267
-
پديد آورنده
اسماعيل حيدري
-
عنوان
يادگيري ماشين در بيماري هاي قلبي - مقايسه عملكرد الگوريتم هاي منتخب
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
رياضي كاربردي -بهينه سازي
-
سال تحصيل
1403
-
تاريخ دفاع
1403/11/08
-
استاد راهنما
دكتر جليل رشيدي نيا/دكتر جواد وحيدي
-
استاد مشاور
-
-
دانشكده
رياضي و علوم كامپيوتر
-
چكيده
تا چند سال اخير، محققان و پزشكان با موانعي در تلاش براي استفاده كامل از داده ها در حوزه ي سلامت مواجه بودند. دستيابي و فيلتر كردن داده ها دشوار و پرهزينه بود. خوشبختانه، پيشرفت هاي فناوري در حوزه ي پزشكي و تحليل داده ها، مشكلات جمع آوري و ذخيره سازي داده ها را تا حد زيادي تسهيل كرده است. با فراواني داده هاي جديد و ابزارهاي تحليلي توسعه يافته ، اكنون سوال اين است كه كدام ابزار براي كاربردهاي مختلف پزشكي مؤثرتر و مناسب تر هستند.
هدف اين پژوهش، تحليل سه مجموعه داده مرتبط با بيماري هاي قلبي با استفاده از پنج الگوريتم طبقه بندي يادگيري ماشين با نظارت است: رگرسيون لجستيك، درخت تصميم، جنگل تصادفي، -kنزديكترين همسايگي و پرسپترون چندلايه. مجموعه داده هاي انتخاب شده از نظر حجم، بازه زماني، ويژگي ها، شرايط و منابع متفاوت بودند تا از نتيجهگيري بر اساس يك مجموعه داده ي واحد جلوگيري شود. هر مجموعه داده با مجموعه كامل ويژگي ها و همچنين با يك مجموعه كاهش يافته براي مقايسه عملكرد با همان الگوريتمها تحليل شد. معيارهاي ارزيابي عملكرد مدل بر اساس دقت پيش بيني آن ها از نظر مساحت زير منحني مشخصه ي عملكرد سيستم (AUC) و زمان محاسباتي آموزش مدل است.
نتايج مقايسه اي، برتري طبقه بندي كننده ي جنگل تصادفي، k -نزديكترين همسايگي و پرسپترون چندلايه را از نظر دقت پيش بيني با زمان محاسباتي به عنوان يك معيار نشان داد. علاوه بر اين، مدل هاي كاهش يافته از نظر دقت پيش بيني و زمان محاسباتي نسبت به مدل هاي كامل خود، رقابت پذيري خوبي ارائه كردند.
-
تاريخ ورود اطلاعات
1404/01/31
-
عنوان به انگليسي
MACHINE LEARNING IN CARDIAC DISEASES - COMPARISON OF PERFORMANCE OF selectED ALGORITHMS
-
تاريخ بهره برداري
1/1/1900 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
اسماعيل حيدري
-
چكيده به لاتين
Until recent years, researchers and practitioners in the healthcare field have had stumbling blocks in their effort to fully utilize and benefit from data. Data were difficult and expensive to obtain and filter. The hardships of data collection and storage were mostly eased with advancements in both medical and data analytics technologies. With an abundance of newly developed data and analytical tools, the question has now become which tools are more effective and appropriate for different medical applications.
Using 5 different supervised machine learning classification algorithms: logistic regression, decision tree, random forest, K-nearest neighbor, and multilayer perceptron. The chosen datasets were of varying sizes, time periods, attributes, conditions, and sources in order to avoid drawing conclusions based on a single dataset. Each dataset was analyzed with the complete set of attributes and with a reduced set for performance comparison within the same algorithms. The model performance evaluation criteria are based on their prediction accuracy in terms of area under the receiver operating characteristic curve (AUC) score and their model training computational times.
The comparative results revealed the superiority of random forest classifier, K-nearest neighbor, and multilayer perceptron in terms of prediction accuracy with computational time as the trade-off. Furthermore, the reduced models provided competitiveness in both prediction accuracy and computational time against their full model counterparts.
-
كليدواژه هاي فارسي
يادگيري ماشين، بيماري قلبي، رگرسيون لجستيك، درخت تصميم، جنگل تصادفي، k-نزديك ترين همسايگي و پرسپترون چندلايه
-
كليدواژه هاي لاتين
Machine learning, Heart disease, Logistic regression, Decision tree, Random forest, K-nearest neighbor, Multilayer perceptron
-
Author
esmaeil heydari
-
SuperVisor
Dr. Javad Vahidi/ Dr. Jalil Rashidinia
-
لينک به اين مدرک :