-
شماره ركورد
23330
-
پديد آورنده
نگار امين پور
-
عنوان
پيش بيني بيماري در مبتلايان به سرطان پستان با استفاده از رويكرد داده كاوي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي صنايع بهينه سازي سيستم ها
-
تاريخ دفاع
1399/12/23
-
استاد راهنما
جناب آقاي دكتر روزبه قوسي
-
استاد مشاور
جناب آقاي دكتر عليرضا آتشي
-
دانشكده
مهندسي صنايع
-
چكيده
امروزه در دانش پزشكي جمع آوري داده ها در مورد بيماري هاي مختلف از اهميت فراواني برخوردار است و
مراكز پزشكي با مقاصد گوناگوني به جمع آوري داده ها مي پردازند. تصقيق روي اين داده ها و به دست آوردن
نتايج و الگوهاي مفيد در رابطه با بيماري ها، يكي از اهداف استفاده از داده ها است. حجم زياد اين داده ها و
سردرگمي حاصل از آن مشكلي است كه مانع رسيدن به نتايج قابل توجه مي شود . بنابراين از داده كاوي
براي غلبه بر اين مشكل و به دست آوردن روابط مفيد بين عوامل خطر زا در بيماري ها استفاده مي شود .
سرطان ها بر اساس نوع سلو هاي كه به آنها گرفتار شده اند، تفكيك و دسته بندي مي شوند و بر اين
اساس بيش از 222 نوع سرطان شناخته شده است. سرطان سينه يكي از شايع ترين نوع سرطان در بين
خانم ها در سراسر جهان است كه اخيرا روند رو به رشدي داشته است. امروزه با پيشرفت تكنولوژي، داده
هاي بسياري درباره سرطان سينه توليد و جمع آوري شده اند اما با توجه به اينكه تجزيه و تصليل اين حجم
از داده ها براي پزشكان دشوار مي باشد لذا براي بررسي و مديريت اين حجم از داده ها از داده كاوي
استفاده مي شود. داده كاوي از ابزارهايي است كه در تشخيص يا پيش بيني سرطان ها از جمله سرطان
سينه به كار مي رود و مي تواند پزشكان را در تيميم گيري و تشخيص زود هنگام بيماري ياري دهد، چرا
كه تشخيص زود هنگام سرطان سينه گامي موثر در جهت كاهش مرگ و مير مبتلايان به اين بيماري است
و امروزه به يكي از چالش برانگيزترين وظايف براي توسعه دهندگان داده كاوي تبديل شده است.
از آنجا كه داده كاوي با اطلاعات و داده هاي كم كيفيت منجر به ارائه دانشي با ضريب اطمينان پايين خواهد
شد لذا در اين تصقيق با استفاده از تكنيك هاي داده كاوي به آماده سازي و پيش پردازش داده هاي جمع
آوري شده از مركز تصقيقات سرطان پستان پرداخته شده است، سپس در جهت پيش بيني متاستاز در
بيماران مبتلا به سرطان پستان از الگوريتم هاي مختلف مد هاي تركيبي يادگيري جمعي شامل درخت
تيادفي، جنگل تيادفي، گراديانت تقويتي، آدابوست، گراديانت تقويتي شديد، گراديانت تقويتي سبك و
تقويت طبقه اي استفاده شده است و ويژگي هاي مهم و تاثير گذار هر كدام به تفكيك مد نشان داده شده
است و در نهايت هر يك از مد ها با استفاده از معيار هاي ارزيابي مورد بررسي قرار گرفته است.
-
تاريخ ورود اطلاعات
1400/01/22
-
عنوان به انگليسي
Prognosis of Breast Cancer Disease in Patients Using Data Mining Approach
-
تاريخ بهره برداري
3/14/2022 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
نگار امين پور
-
چكيده به لاتين
Today, in medical knowledge, collecting data about various diseases is essential, and medical centers collect data for various purposes. One goal of using the data is to research this data and obtain useful results and patterns about diseases. Therefore, data mining is used to find useful relationships between risk factors in diseases.
Cancers are classified according to the type of cells they are infected with, and more than 200 types of cancer are known accordingly. Breast cancer is one of the most common types of cancer among women worldwide and has recently been rising. Today, with the advancement of technology, a lot of data about breast cancer has been produced and collected, but due to the fact that it is difficult for physicians to analyze this amount of data, so data mining is used to examine and manage this amount of data. Data mining is a tool used in the diagnosis or prediction of cancers, including breast cancer. It can help physicians make decisions and diagnose the disease early because early detection of breast cancer is a practical step in reducing death from this disease, and today, it has become one of the most challenging tasks for data mining developers.
Since data mining with low-quality information and data will lead to providing knowledge with low reliability, so in this study, data mining techniques are used to prepare and pre-process the data collected from the Breast Cancer Research Center in order to predict metastasis in breast cancer patients, different algorithms of ensemble learning models including Extra tree, Random Forest, Gradient Boosting, AdaBoost, Extreme Gradient Boosting, Light Gb and cat boost have been used. And the effective features of each model are shown
-
كليدواژه هاي فارسي
داده كاوي , پيش بيني , طبقه بندي , يادگيري جمعي , سرطان پستان
-
كليدواژه هاي لاتين
Data mining , Prognosis , Classification , Ensemble learning , Breast Cancer
-
لينک به اين مدرک :