-
شماره ركورد
25219
-
پديد آورنده
نيكتا كياني
-
عنوان
آناليز عملكرد الگوريتم هاي طبقه بندي در داده كاوي به منظور تشخيص سرطان پستان
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع
-
سال تحصيل
1397-1400
-
تاريخ دفاع
1400/4/9
-
استاد راهنما
محمد سعيدي مهرآباد
-
دانشكده
مهندسي صنايع
-
چكيده
سرطان پستان شايعترين سرطان در ميان زنان است و همچنين علت اصلي مرگ و مير ناشي از سرطان در زنان سراسر جهان به شمار ميرود. با توجه به نرخ فزاينده ي وقوع سرطان پستان در سطح جهان، تشخيص زودهنگام اين بيماري در كاهش تلفات و حفظ بقا حائز اهميت بوده و لزوم تشخيص آن در كوتاه ترين زمان به منظور شروع فرآيند درماني و جلوگيري از پيش روي اين نوع سرطان امري ضروري است. هدف از اين پژوهش توسعه ي مدل تشخيص سرطان پستان با نظر به نشانگرهاي زيستي در آزمايش خون افراد ميباشد كه اين امر به كمك ساخت مدل پيش بيني بر مبناي تحليل هاي آماري و تكنيك ها داده كاوي انجام گرفته است. ساخت اين مدل بر اساس داده ها و پارامترهايي نظير ؛ ميزان گلوكز ، رزيستين ، شاخص توده بدن ، انسولين و سن افراد كه مي توان در آزمايشات معمول خون آنها را جمع آوري كرد ،انجام ميگيرد. كاهش هزينه ها و سهولت در ساخت مدل پيش بيني با كمك پارامترهاي نام برده و همزمان قدرت تشخيصي بالا و دقت قابل ملاحظه ، از دلايل انجام اين پژوهش بوده است. در اين راستا 4 الگوريتم طبقه بندي در داده كاوي ، با عناوين درخت تصميم ، جنگل تصادفي ، بيز ساده و ماشين بردار پشتيبان در حالت استاندارد و وزن داده شده براساس نوع عملكرد و معيارهاي ارزيابي مورد مقايسه قرار گرفتند. اين الگوريتم ها بر روي مجموعه اطلاعات 116 زن از بخش زنان و زايمان مركز بيمارستان دانشگاه كويمبرا مورد بررسي قرار گرفته اند . 64 نفر از اين افراد بين سالهاي 2009 و 2013 مبتلا به سرطان پستان تشخيص داده شده و 52 نفر افراد سالم اين گروه بوده اند. نتايج مقايسات انجام شده در اين تحقيق بيانگر اين است مدل جنگل تصادفي با دقت 74% و مقدار F3 برابر 83.32% عملكرد مناسبي داشته است. همچنين مدل ماشين بردار پشتيبان در پيش بيني از نظر دقت با مقدار 73.91 % در بين الگوريتم هاي موجود كاركرد قابل قبولي داشته است.
-
تاريخ ورود اطلاعات
1400/06/25
-
عنوان به انگليسي
Performance Analysis of Classification Algorithms in Data mining for Breast Cancer Diagnosis
-
تاريخ بهره برداري
6/30/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
نيكتا كياني
-
چكيده به لاتين
Breast cancer is the most common cancer among women and is also the leading cause of cancer deaths in women across the world. Given the in-creasing incidence of breast cancer, early detection of this disease is crucial in reducing mortality. The need to diagnose it in the shortest time is essential for beginning the treatment process as soon as possible and pre-venting this type of cancer from getting dangerous. The purpose of this study is to develop a breast cancer diagnosis model based on biomarkers in blood tests, which has been done by constructing a predictive model based on statistical analysis and data mining techniques. Building this model based on data and parameters such as; Glucose, resistin, body mass index, insulin, and age can be measured in routine blood tests. Re-duction of costs and ease of making a prediction model with the help of the mentioned parameters and at the same time, high diagnostic power and considerable accuracy have been the reasons for conducting this re-search. In this regard, four classification algorithms in data mining were compared with the titles of the Decision tree, Random forest, Naive Bayes, and Support vector machine in standard mode and given a weight based on the type of performance and evaluation criteria. These algorithms were examined on the data set of 116 women from the obstetrics and gynecology department of the University Hospital of Coimbra. 64 of these people were diagnosed with breast cancer between 2009 and 2013, and 52 were healthy people in this group. The results of comparisons made in this study indicate that the Random Forest model has the highest F3 measure,83.32% and support vector machine model has a good performance in forecasting accuracy with 73.91% among the existing algorithms.
-
كليدواژه هاي فارسي
سرطان پستان , داده كاوي , طبقه بندي , مدل پيش بيني , نشانگر هاي زيستي
-
كليدواژه هاي لاتين
Breast Cancer , Datamining , Classification , Predictive Models , Biomarkers
-
لينک به اين مدرک :