شماره ركورد
28846
پديد آورنده
زهرا صائبي منفرد
عنوان
ارائه يك سيستم توصيهگر براساس سوابق وراثتي براي بيماريهاي سرطاني( مطالعه موردي: استان گلستان)
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي صنايع
سال تحصيل
1399
تاريخ دفاع
1402/03/23
استاد راهنما
دكتر فرناز برزين پور
استاد مشاور
دكتر محمدرضا رسولي- دكتر عليرضا آتشي
دانشكده
مهندسي صنايع
چكيده
سرطان، يكي از دلايل اصلي مرگ در سراسر جهان ميباشد. فاكتور اصلي در كاهش مرگ و مير ناشي از اين بيماري، تشخيص سريع و صحيح است. ازاينرو، بااستفاده از دادههاي بيماران مبتلا به سرطان كه طي سالهاي اخير به تعداد قابلتوجهي جمعآوري شدهاند، ميتوان تشخيصهاي لازم در زمينه وراثت سرطان را انجام داد و طبق قوانين استخراجشده، توصيههاي پيشگيرانه و كاربردي را ارائه كرد. استان گلستان از ديرباز بعنوان يكي از مناطق پرخطر براي سرطان ها بخصوص سرطانهاي گوارشي شامل سرطانهاي كبد، روده كوچك و بزرگ، مري، معده و لوزالمعده شناخته شده است. يكي از نكات مهم در كنترل سرطانها، پيشآگهي آن ميباشد. با توجه به بروز بالاي سرطانها و نقش بانك زيستي سرطان در طراحي مطالعات كاربردي، پروژه بيوبانك سرطان گلستان جهت ايجاد بستري مناسب براي طراحي و اجراي پروژه هاي تحقيقاتي كاربردي در زمينه سرطان طراحي شد. پروژه كوهورت استان گلستان يكي از زيرساختهاي غني و بسيار با ارزش پژوهشي در استان گلستان ميباشد كه از سال 1384 آغاز شده است. اين پروژه بر روي 50000 نفر از ساكنين منطقه شرق استان گلستان در حال اجرا بوده و هدف اصلي آن تعيين عوامل خطر سرطانهاي دستگاه گوارش فوقاني بوده است. در اين پاياننامه، ابتدا متغيرها جهت استفاده در مدلها و الگوريتمها توسط متخصص تعيين شد. سپس دادهها براي آمادهسازي براي ورود به الگوريتم، دستهبندي و نامگذاري شدند. در مرحلهي بعد مقادير گمشده جايگزين و روي دادهها يكپارچهسازي و آميختهسازي صورت گرفت دادههاي سرطانهاي گوارشي كه 733 عدد بود، جداسازي شد. همچنين به منظور بهبود نتايج، متغيرها به صورت موضوعي دستهبندي شد و سپس روي هر گروه متغير، كاهش ابعاد با استفاده از خوشهبندي انجام شد. در اين پژوهش، الگوريتم RApriori توسعه داده شده است كه از طريق تعريف مجموعه موخر، بسياري از قوانين زائد را حذف كرده و الگوهاي حاصل از آن، به اين روش منطقيسازي شده و با استفاده از تابع مطلوبيت تعريف شده، امكان رتبهبندي و مقايسه الگوهاي بدست آمده وجود دارد. الگوريتمهاي RApriori ، رشد FP، Eclatو خوشهبندي K-modes بر روي دادههاي آمادهسازي شده، پيادهسازي و مقايسه شد كه به ترتيب الگوريتمهاي آراپريوري، خوشهبندي كامدز و رشد افپي به لحاظ مفيد بودن خروجي، تفسيرپذيري آن و همچنين زمان اجرا، عملكرد مناسبي نشان دادند. در مجموع تحليل خروجيها و طبق تحليل و اعمال نظر متخصص، چند قانون مفيد در موضوع ارتباط ابتلا به سرطان مري و روده بزرگ بدست آمد.
تاريخ ورود اطلاعات
1402/07/18
عنوان به انگليسي
Providing a recommender system based on inheritance records for cancer diseases (A case study in Golestan province)
تاريخ بهره برداري
6/12/2024 12:00:00 AM
دانشجوي وارد كننده اطلاعات
زهرا صائبي منفرد
چكيده به لاتين
Cancer is one of the leading causes of death worldwide. The main factor in reducing mortality from this disease is early and accurate diagnosis. Therefore, by utilizing the data of cancer patients that have been collected in significant numbers in recent years, necessary diagnoses regarding the heredity of cancer can be made, and based on the derived rules, preventive and practical recommendations can be provided. Golestan Province has long been known as a high-risk area for cancer, especially gastrointestinal cancers including liver, small intestine, large intestine, esophagus, stomach, and colorectal cancers. Early detection is one of the key points in cancer control. Considering the high incidence of cancers and the role of the cancer biobank in designing practical studies, the Golestan Cancer Biobank project was designed to create an appropriate platform for the design and implementation of applied research projects in the field of cancer. The Golestan Cohort Project is one of the rich and valuable research infrastructures in Golestan Province, which started in 2005. This project is being implemented on 50,000 residents of the eastern region of Golestan Province, and its main objective is to identify the risk factors for upper gastrointestinal cancers. In this thesis, first, the variables were determined by an expert for use in models and algorithms. Then the data were prepared for entry into the algorithm, categorized, and labeled. In the next step, missing values were replaced, and the data were harmonized and mixed. The gastrointestinal cancer data, which consisted of 733 cases, were separated. Furthermore, to improve the results, variables were categorized thematically, and dimensionality reduction was performed on each variable group using clustering. In this research, a developed algorithm called RApriori was introduced, which eliminates many redundant rules and rationalizes the resulting patterns through the definition of a posterior set. The algorithms RApriori, FP-growth, ECLAT, and K-modes clustering were implemented and compared on the prepared data in terms of output usefulness, interpretability, and execution time. the RApriori, K-modes clustering, and FP-growth algorithms showed satisfactory performance. Totaly , the analysis of the outputs and according to the analysis and application of the expert's opinion, some useful rules were obtained on the issue of the relationship between esophageal and colon cancer.
كليدواژه هاي فارسي
قانونكاوي انجمني , سرطان , وراثت , منطقي سازي , يادگيري ماشين
كليدواژه هاي لاتين
Associative rule mining , Cancer , Heredity , Rationalization , Machine learning
Author
Zahra Saebi monfared
SuperVisor
Farnaz Barzinpour