• شماره ركورد
    28846
  • پديد آورنده

    زهرا صائبي منفرد

  • عنوان
    ارائه يك سيستم توصيه‌گر بر‌اساس سوابق وراثتي براي بيماري‌هاي سرطاني( مطالعه موردي: استان گلستان)
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي صنايع
  • سال تحصيل
    1399
  • تاريخ دفاع
    1402/03/23
  • استاد راهنما
    دكتر فرناز برزين پور
  • استاد مشاور
    دكتر محمدرضا رسولي- دكتر عليرضا آتشي
  • دانشكده
    مهندسي صنايع
  • چكيده
    سرطان، يكي از دلايل اصلي مرگ در سراسر جهان مي‌باشد. فاكتور اصلي در كاهش مرگ و مير ناشي از اين بيماري، تشخيص سريع و صحيح است. از‌اين‌رو، با‌استفاده از داده‌هاي بيماران مبتلا به سرطان كه طي سال‌هاي اخير به تعداد قابل‌توجهي جمع‌آوري شده‌اند، مي‌توان تشخيص‌هاي لازم در زمينه وراثت سرطان را انجام داد و طبق قوانين استخراج‌شده، توصيه‌هاي پيش‌گيرانه‌ و كاربردي را ارائه كرد. استان گلستان از ديرباز بعنوان يكي از مناطق پرخطر براي سرطان ها بخصوص سرطان‌هاي گوارشي شامل سرطان‌هاي كبد، روده كوچك و بزرگ، مري، معده و لوزالمعده شناخته شده است. يكي از نكات مهم در كنترل سرطان‌ها، پيش‌آگهي آن مي‌باشد. با توجه به بروز بالاي سرطان‌ها و نقش بانك زيستي سرطان در طراحي مطالعات كاربردي، پروژه بيوبانك سرطان گلستان جهت ايجاد بستري مناسب براي طراحي و اجراي پروژه هاي تحقيقاتي كاربردي در زمينه سرطان طراحي شد. پروژه كوهورت استان گلستان يكي از زيرساخت‌هاي غني و بسيار با ارزش پژوهشي در استان گلستان مي‌باشد كه از سال 1384 آغاز شده است. اين پروژه بر روي 50000 نفر از ساكنين منطقه شرق استان گلستان در حال اجرا بوده و هدف اصلي آن تعيين عوامل خطر سرطان‌هاي دستگاه گوارش فوقاني بوده است. در اين پايان‌نامه، ابتدا متغيرها جهت استفاده در مدل‌ها و الگوريتم‌ها توسط متخصص تعيين شد. سپس داده‌ها براي آماده‌سازي براي ورود به الگوريتم، دسته‌بندي و نامگذاري شدند. در مرحله‌ي بعد مقادير گمشده جايگزين و روي داده‌ها يكپارچه‌سازي و آميخته‌سازي صورت گرفت داده‌هاي سرطان‌هاي گوارشي كه 733 عدد بود، جدا‌سازي شد. همچنين به منظور بهبود نتايج، متغير‌ها به صورت موضوعي دسته‌بندي شد و سپس روي هر گروه متغير، كاهش ابعاد با استفاده از خوشه‌بندي انجام شد. در اين پژوهش، الگوريتم RApriori توسعه داده شده است كه از طريق تعريف مجموعه موخر، بسياري از قوانين زائد را حذف كرده و الگو‌هاي حاصل از آن، به اين روش منطقي‌سازي شده‌ و با استفاده از تابع مطلوبيت تعريف شده، امكان رتبه‌بندي و مقايسه الگو‌هاي بدست آمده وجود دارد. الگوريتم‌هاي RApriori ، رشد FP، Eclatو خوشه‌بندي K-modes بر روي داده‌هاي آماده‌سازي شده، پياده‌سازي و مقايسه شد كه به ترتيب الگوريتم‌هاي آراپريوري، خوشه‌بندي كامدز و رشد اف‌پي به لحاظ مفيد بودن خروجي، تفسير‌پذيري آن و همچنين زمان اجرا، عملكرد مناسبي نشان دادند. در مجموع تحليل خروجي‌ها و طبق تحليل و اعمال نظر متخصص، چند قانون مفيد در موضوع ارتباط ابتلا به سرطان مري و روده بزرگ بدست آمد.
  • تاريخ ورود اطلاعات
    1402/07/18
  • عنوان به انگليسي
    Providing a recommender system based on inheritance records for cancer diseases (A case study in Golestan province)
  • تاريخ بهره برداري
    6/12/2024 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    زهرا صائبي منفرد

  • چكيده به لاتين
    Cancer is one of the leading causes of death worldwide. The main factor in reducing mortality from this disease is early and accurate diagnosis. Therefore, by utilizing the data of cancer patients that have been collected in significant numbers in recent years, necessary diagnoses regarding the heredity of cancer can be made, and based on the derived rules, preventive and practical recommendations can be provided. Golestan Province has long been known as a high-risk area for cancer, especially gastrointestinal cancers including liver, small intestine, large intestine, esophagus, stomach, and colorectal cancers. Early detection is one of the key points in cancer control. Considering the high incidence of cancers and the role of the cancer biobank in designing practical studies, the Golestan Cancer Biobank project was designed to create an appropriate platform for the design and implementation of applied research projects in the field of cancer. The Golestan Cohort Project is one of the rich and valuable research infrastructures in Golestan Province, which started in 2005. This project is being implemented on 50,000 residents of the eastern region of Golestan Province, and its main objective is to identify the risk factors for upper gastrointestinal cancers. In this thesis, first, the variables were determined by an expert for use in models and algorithms. Then the data were prepared for entry into the algorithm, categorized, and labeled. In the next step, missing values were replaced, and the data were harmonized and mixed. The gastrointestinal cancer data, which consisted of 733 cases, were separated. Furthermore, to improve the results, variables were categorized thematically, and dimensionality reduction was performed on each variable group using clustering. In this research, a developed algorithm called RApriori was introduced, which eliminates many redundant rules and rationalizes the resulting patterns through the definition of a posterior set. The algorithms RApriori, FP-growth, ECLAT, and K-modes clustering were implemented and compared on the prepared data in terms of output usefulness, interpretability, and execution time. the RApriori, K-modes clustering, and FP-growth algorithms showed satisfactory performance. Totaly , the analysis of the outputs and according to the analysis and application of the expert's opinion, some useful rules were obtained on the issue of the relationship between esophageal and colon cancer.
  • كليدواژه هاي فارسي
    قانون‌كاوي انجمني , سرطان , وراثت , منطقي سازي , يادگيري ماشين
  • كليدواژه هاي لاتين
    Associative rule mining , Cancer , Heredity , Rationalization , Machine learning
  • Author
    Zahra Saebi monfared
  • SuperVisor
    Farnaz Barzinpour