• شماره ركورد
    33771
  • پديد آورنده

    مرتضي رخشاني نژاد

  • عنوان
    توسعه مدل تشخيص سرطان پستان و تجويز درمان مناسب با استفاده از داده‌هاي ژنوميك و الگوريتم‌هاي يادگيري ماشين
  • مقطع تحصيلي
    دكتري
  • رشته تحصيلي
    مهندسي فناوري اطلاعات
  • سال تحصيل
    1398
  • تاريخ دفاع
    1404/7/14
  • استاد راهنما
    دكتر محمد فتحيان
  • استاد مشاور
    دكتر فرناز برزين پور
  • دانشكده
    مهندسي صنايع
  • چكيده
    سرطان پستان يكي از شايع‌ترين انواع سرطان در زنان به‌شمار مي‌رود كه تشخيص زودهنگام و درمان آن نيازمند بهره‌گيري از روش‌هاي محاسباتي پيشرفته و تحليل‌ داده‌هاي زيستي است. هدف اصلي اين رساله، توسعهٔ يك چارچوب چندمرحله‌اي و جامع مبتني بر يادگيري ماشين، الگوريتم‌هاي فراابتكاري و روش‌هاي كمي‌سازي عدم‌قطعيت براي شناسايي نشانگرهاي زيستي و پيشنهاد درمان‌هاي دقيق براي سرطان پستان مي‌باشد. نوآوري اصلي اين پژوهش در سه بخش نهفته است: نخست، طراحي الگوريتم تركيبي جديد BGWO_SA_Ens و مدل انتخاب ويژگي مبتني بر الگوريتم خودرمزگذار براي انتخاب ژن‌هاي كليدي؛ دوم، بهبود مدل‌هاي يادگيري عميق براي پيش‌بيني تعامل دارو–پروتئين با استفاده از انتخاب پارامترهاي بهينه كه هم‌زمان ميزان عدم قطعيت و دقت پيش‌بيني در آن‌ها در نظر گرفته شده است؛ سوم، استفاده از مدل‌هاي پيش‌بيني هم‌ساز براي افزودن لايه‌اي از تحليل عدم‌قطعيت به‌منظور تبديل نتايج مدل به بازه‌هاي اطمينان و فراهم‌كردن مباني مورد نياز يك سيستم تصميم‌يار براي متخصصان. در گام نخست، مجموعه‌اي از داده‌هاي بيان ژن از پايگاه‌هاي معتبر گردآوري شد و با استفاده از الگوريتم‌هاي انتخاب ويژگي توسعه داده شده تعداد محدودي ژن با قابليت تمايزبخشي بالا شناسايي گرديد. سپس با تحليل‌هاي زيستي مانند غني‌سازي مسيرها و شبكه‌هاي پروتئيني، نقش زيستي و باليني ژن‌هاي منتخب مورد بررسي قرار گرفت. در ادامه، داروهاي مرتبط با اين ژن‌ها از پايگاه‌هاي موجود استخراج شدند و با استفاده از مدل‌هاي يادگيري عميق، پيش‌بيني تعامل دارو–هدف انجام گرفت. براي افزايش دقت و قابليت اعتماد مدل، تنظيم پارامترها با استفاده از الگوريتم‌هاي چندهدفه NSGA-II و MOPSO صورت گرفت و نهايتاً با بهره‌گيري از روش‌هاي پيش‌بيني هم‌ساز، بازه‌هاي اطمينان براي پيش‌بيني‌ها محاسبه شد. بخش آخر به‌عنوان يك نوآوري مهم، امكان ارائهٔ نتايج همراه با ميزان عدم‌قطعيت را فراهم ساخت كه در كاربردهاي باليني بسيار ارزشمند است. نتايج تجربي نشان دادند كه چارچوب پيشنهادي توانسته است به‌طور مؤثر ژن‌هاي كليدي و داروهاي بالقوه را شناسايي كرده و تعاملات دارويي را با دقت بالا و همراه با تخمين عدم‌قطعيت پيش‌بيني نمايد. در مجموع، با تلفيق ژن‌هاي افتراقي و خروجي الگوريتم BGWO_SA_Ens، تعداد 35 ژن برتر شناسايي شد كه از ميان آن‌ها ژن‌هاي TOP2A، AKR1C3، EZH2، MMP1، EDNRB، S100B و SPP1 نقش ويژه‌اي در پيش‌بيني سرطان پستان ايفا كردند. تحليل‌هاي غني‌سازي GO و KEGG نشان دادند كه اين ژن‌ها در مسيرهاي كليدي مرتبط با سرطان نظير AMPK، Adipocytokine و PPAR نقش فعالي دارند. همچنين عملكرد مدل پيش‌بيني‌كننده بر اساس ژن‌هاي منتخب بسيار مطلوب ارزيابي شد، به‌طوري‌كه مقدار F1-score معادل 0.984 به‌دست آمد كه نشان‌دهندهٔ دقت بالاي مدل نهايي مي‌باشد. بدين ترتيب، اين پژوهش با تأكيد بر نوآوري در تركيب الگوريتم‌هاي فراابتكاري، يادگيري عميق و كمي‌سازي عدم‌قطعيت، گامي مؤثر در جهت توسعهٔ پزشكي دقيق در حوزهٔ سرطان پستان برداشته است.
  • تاريخ ورود اطلاعات
    1404/07/16
  • عنوان به انگليسي
    Developing a breast cancer detection model an‎d prescribing appropriate treatment using genetic data an‎d machine learning algorithms
  • تاريخ بهره برداري
    10/6/2026 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    مرتضي رخشاني نژاد

  • چكيده به لاتين
    Breast cancer is one of the most preva‎lent types of cancer in women. Its early diagnosis an‎d treatment require advanced computational methods an‎d precise analysis of biological data. The main contribution of this dissertation lies in three innovations: first, the design of a novel hybrid algorithm BGWO_SA_Ens along with an autoencoder-based feature selec‎tion model to identify key genes; second, the enhancement of deep learning models for drug–protein interaction prediction by employing optimized hyperparameters that jointly account for both predictive accuracy an‎d uncertainty; an‎d third, the application of conformal prediction models to add a layer of uncertainty quantification, transforming model outputs into confidence intervals an‎d providing the foundations for a decision-support system for clinical experts. In the first stage, gene expression datasets were collected from reputable public repositories, an‎d a limited number of highly discriminative genes were identified through the proposed feature selec‎tion algorithms. Subsequently, biological analyses such as pathway enrichment an‎d protein-protein interaction networks were conducted to eva‎luate the biological an‎d clinical relevance of the selec‎ted genes. Related drugs were then retrieved from existing drug-gene databases, an‎d drug–target interaction prediction was performed using deep learning models. To further enhance accuracy an‎d robustness, hyperparameter tuning was carried out using multi-objective optimization algorithms NSGA-II an‎d MOPSO. Finally, conformal prediction was employed to calculate confidence intervals for the predictions. This final step, as an important innovation, enabled the presentation of results together with their quantified uncertainty, which is highly valuable in clinical practice. Experimental results demonstrated that the proposed framework effectively identifies key genes an‎d potential drugs an‎d achieves highly accurate interaction predictions with quantified uncertainty. In total, by integrating differentially expressed genes with the output of the BGWO_SA_Ens algorithm, 35 top-ranked genes were identified. Among them, TOP2A, AKR1C3, EZH2, MMP1, EDNRB, S100B, an‎d SPP1 played particularly important roles in breast cancer prediction. Enrichment analysis using GO an‎d KEGG confirmed that these genes are actively involved in critical cancer-related pathways such as AMPK, Adipocytokine, an‎d PPAR. The final predictive model, based on the selec‎ted gene set, achieved excellent performance with an F1-score of 0.984, indicating its high accuracy an‎d reliability. In summary, by emphasizing the integration of metaheuristic optimization, deep learning, an‎d uncertainty quantification, this dissertation makes an effective contribution toward the development of precision medicine in breast cancer.
  • كليدواژه هاي فارسي
    سرطان پستان , كشف نشانگرهاي زيستي , يادگيري ماشين , الگوريتم‌هاي فراابتكاري تركيبي , كمي‌سازي عدم‌قطعيت , پيش‌بيني تعاملات دارو-هدف
  • كليدواژه هاي لاتين
    Breast cancer , Biomarker discovery , Machine Learning , Hybrid metaheuristic algorithm , Uncertainty quantification , Drug-Target interaction prediction
  • Author
    Morteza Rakhshaninejad
  • SuperVisor
    Mohammad Fathian