چکيده
امروزه در دانش پزشكي جمع آوري داده ها در مورد بيماري هاي مختلف از اهميت فراواني برخوردار است و
مراكز پزشكي با مقاصد گوناگوني به جمع آوري داده ها مي پردازند. تحقيق روي اين داده ها و به دست آوردن
نتايج و الگوهاي مفيد در رابطه با بيماري ها، يكي از اهداف استفاده از داده ها است. حجم زياد اين داده ها و
سردرگمي حاصل از آن مشكلي است كه مانع رسيدن به نتايج قابل توجه مي شود . بنابراين از داده كاوي
براي غلبه بر اين مشكل و به دست آوردن روابط مفيد بين عوامل خطر زا در بيماري ها استفاده مي شود.
سرطان ها بر اساس نوع سلول هاي كه به آنها گرفتار شده اند، تفكيك و دسته بندي مي شوند و بر اين
اساس بيش از 200 نوع سرطان شناخته شده است. سرطان سينه يكي از شايع ترين نوع سرطان در بين
خانم ها در سراسر جهان است كه اخيرا روند رو به رشدي داشته است. امروزه با پيشرفت تكنولوژي، داده
هاي بسياري درباره سرطان سينه توليد و جمع آوري شده اند اما با توجه به اينكه تجزيه و تحليل اين حجم
از داده ها براي پزشكان دشوار مي باشد لذا براي بررسي و مديريت اين حجم از داده ها از داده كاوي
استفاده مي شود. داده كاوي از ابزارهايي است كه در تشخيص يا پيش بيني سرطان ها از جمله سرطان
سينه به كار مي رود و مي تواند پزشكان را در تصميم گيري و تشخيص زود هنگام بيماري ياري دهد، چرا
كه تشخيص زود هنگام سرطان سينه گامي موثر در جهت كاهش مرگ و مير مبتلايان به اين بيماري است
و امروزه به يكي از چالش برانگيزترين وظايف براي توسعه دهندگان داده كاوي تبديل شده است.
در اين تحقيق به بررسي تكنيك ها و مقالات موجود در حوزه داده كاوي در بيماري سرطان سينه پرداخته
شده است، از نتايج اين پژوهش مي توان به كشف الگوريتم هاي پرتكرار و معرفي شكاف هاي تحقيقاتي و
پيشنهادات آتي در اين حوزه اشاره كرد.