شماره ركورد
33771
پديد آورنده
مرتضي رخشاني نژاد
عنوان
توسعه مدل تشخيص سرطان پستان و تجويز درمان مناسب با استفاده از دادههاي ژنوميك و الگوريتمهاي يادگيري ماشين
مقطع تحصيلي
دكتري
رشته تحصيلي
مهندسي فناوري اطلاعات
سال تحصيل
1398
تاريخ دفاع
1404/7/14
استاد راهنما
دكتر محمد فتحيان
استاد مشاور
دكتر فرناز برزين پور
دانشكده
مهندسي صنايع
چكيده
سرطان پستان يكي از شايعترين انواع سرطان در زنان بهشمار ميرود كه تشخيص زودهنگام و درمان آن نيازمند بهرهگيري از روشهاي محاسباتي پيشرفته و تحليل دادههاي زيستي است. هدف اصلي اين رساله، توسعهٔ يك چارچوب چندمرحلهاي و جامع مبتني بر يادگيري ماشين، الگوريتمهاي فراابتكاري و روشهاي كميسازي عدمقطعيت براي شناسايي نشانگرهاي زيستي و پيشنهاد درمانهاي دقيق براي سرطان پستان ميباشد. نوآوري اصلي اين پژوهش در سه بخش نهفته است: نخست، طراحي الگوريتم تركيبي جديد BGWO_SA_Ens و مدل انتخاب ويژگي مبتني بر الگوريتم خودرمزگذار براي انتخاب ژنهاي كليدي؛ دوم، بهبود مدلهاي يادگيري عميق براي پيشبيني تعامل دارو–پروتئين با استفاده از انتخاب پارامترهاي بهينه كه همزمان ميزان عدم قطعيت و دقت پيشبيني در آنها در نظر گرفته شده است؛ سوم، استفاده از مدلهاي پيشبيني همساز براي افزودن لايهاي از تحليل عدمقطعيت بهمنظور تبديل نتايج مدل به بازههاي اطمينان و فراهمكردن مباني مورد نياز يك سيستم تصميميار براي متخصصان. در گام نخست، مجموعهاي از دادههاي بيان ژن از پايگاههاي معتبر گردآوري شد و با استفاده از الگوريتمهاي انتخاب ويژگي توسعه داده شده تعداد محدودي ژن با قابليت تمايزبخشي بالا شناسايي گرديد. سپس با تحليلهاي زيستي مانند غنيسازي مسيرها و شبكههاي پروتئيني، نقش زيستي و باليني ژنهاي منتخب مورد بررسي قرار گرفت. در ادامه، داروهاي مرتبط با اين ژنها از پايگاههاي موجود استخراج شدند و با استفاده از مدلهاي يادگيري عميق، پيشبيني تعامل دارو–هدف انجام گرفت. براي افزايش دقت و قابليت اعتماد مدل، تنظيم پارامترها با استفاده از الگوريتمهاي چندهدفه NSGA-II و MOPSO صورت گرفت و نهايتاً با بهرهگيري از روشهاي پيشبيني همساز، بازههاي اطمينان براي پيشبينيها محاسبه شد. بخش آخر بهعنوان يك نوآوري مهم، امكان ارائهٔ نتايج همراه با ميزان عدمقطعيت را فراهم ساخت كه در كاربردهاي باليني بسيار ارزشمند است. نتايج تجربي نشان دادند كه چارچوب پيشنهادي توانسته است بهطور مؤثر ژنهاي كليدي و داروهاي بالقوه را شناسايي كرده و تعاملات دارويي را با دقت بالا و همراه با تخمين عدمقطعيت پيشبيني نمايد. در مجموع، با تلفيق ژنهاي افتراقي و خروجي الگوريتم BGWO_SA_Ens، تعداد 35 ژن برتر شناسايي شد كه از ميان آنها ژنهاي TOP2A، AKR1C3، EZH2، MMP1، EDNRB، S100B و SPP1 نقش ويژهاي در پيشبيني سرطان پستان ايفا كردند. تحليلهاي غنيسازي GO و KEGG نشان دادند كه اين ژنها در مسيرهاي كليدي مرتبط با سرطان نظير AMPK، Adipocytokine و PPAR نقش فعالي دارند. همچنين عملكرد مدل پيشبينيكننده بر اساس ژنهاي منتخب بسيار مطلوب ارزيابي شد، بهطوريكه مقدار F1-score معادل 0.984 بهدست آمد كه نشاندهندهٔ دقت بالاي مدل نهايي ميباشد. بدين ترتيب، اين پژوهش با تأكيد بر نوآوري در تركيب الگوريتمهاي فراابتكاري، يادگيري عميق و كميسازي عدمقطعيت، گامي مؤثر در جهت توسعهٔ پزشكي دقيق در حوزهٔ سرطان پستان برداشته است.
تاريخ ورود اطلاعات
1404/07/16
عنوان به انگليسي
Developing a breast cancer detection model and prescribing appropriate treatment using genetic data and machine learning algorithms
تاريخ بهره برداري
10/6/2026 12:00:00 AM
دانشجوي وارد كننده اطلاعات
مرتضي رخشاني نژاد
چكيده به لاتين
Breast cancer is one of the most prevalent types of cancer in women. Its early diagnosis and treatment require advanced computational methods and precise analysis of biological data. The main contribution of this dissertation lies in three innovations: first, the design of a novel hybrid algorithm BGWO_SA_Ens along with an autoencoder-based feature selection model to identify key genes; second, the enhancement of deep learning models for drug–protein interaction prediction by employing optimized hyperparameters that jointly account for both predictive accuracy and uncertainty; and third, the application of conformal prediction models to add a layer of uncertainty quantification, transforming model outputs into confidence intervals and providing the foundations for a decision-support system for clinical experts. In the first stage, gene expression datasets were collected from reputable public repositories, and a limited number of highly discriminative genes were identified through the proposed feature selection algorithms. Subsequently, biological analyses such as pathway enrichment and protein-protein interaction networks were conducted to evaluate the biological and clinical relevance of the selected genes. Related drugs were then retrieved from existing drug-gene databases, and drug–target interaction prediction was performed using deep learning models. To further enhance accuracy and robustness, hyperparameter tuning was carried out using multi-objective optimization algorithms NSGA-II and MOPSO. Finally, conformal prediction was employed to calculate confidence intervals for the predictions. This final step, as an important innovation, enabled the presentation of results together with their quantified uncertainty, which is highly valuable in clinical practice. Experimental results demonstrated that the proposed framework effectively identifies key genes and potential drugs and achieves highly accurate interaction predictions with quantified uncertainty. In total, by integrating differentially expressed genes with the output of the BGWO_SA_Ens algorithm, 35 top-ranked genes were identified. Among them, TOP2A, AKR1C3, EZH2, MMP1, EDNRB, S100B, and SPP1 played particularly important roles in breast cancer prediction. Enrichment analysis using GO and KEGG confirmed that these genes are actively involved in critical cancer-related pathways such as AMPK, Adipocytokine, and PPAR. The final predictive model, based on the selected gene set, achieved excellent performance with an F1-score of 0.984, indicating its high accuracy and reliability. In summary, by emphasizing the integration of metaheuristic optimization, deep learning, and uncertainty quantification, this dissertation makes an effective contribution toward the development of precision medicine in breast cancer.
كليدواژه هاي فارسي
سرطان پستان , كشف نشانگرهاي زيستي , يادگيري ماشين , الگوريتمهاي فراابتكاري تركيبي , كميسازي عدمقطعيت , پيشبيني تعاملات دارو-هدف
كليدواژه هاي لاتين
Breast cancer , Biomarker discovery , Machine Learning , Hybrid metaheuristic algorithm , Uncertainty quantification , Drug-Target interaction prediction
Author
Morteza Rakhshaninejad
SuperVisor
Mohammad Fathian