• شماره ركورد
    10345
  • پديد آورنده

    علي عليزاده

  • عنوان
    ارائه ي رويكردي مبتني بر يادگيري عميق براي پيش بيني ساختار ريبونوكلئيك اسيد (RNA)
  • مقطع تحصيلي
    كارشناسي
  • رشته تحصيلي
    مهندسي كامپيوتر
  • سال فارغ التحصيلي
    1405
  • استاد راهنما
    دكتر رضا انتظاري-ملكي
  • دانشجوي وارد كننده اطلاعات

    علي عليزاده

  • تاريخ ورود اطلاعات
    1405/03/02
  • دانشكده
    مهندسي كامپيوتر
  • عنوان به انگليسي
    A deep learning–based approach for predicting the structure of ribonucleic acid (RNA)
  • چكيده
    پيش‌بيني ساختار دوم RNA از روي توالي‌هاي نوكلئوتيدي يكي از مسائل بنيادي و چالش‌برانگيز در بيوانفورماتيك محاسباتي است كه نقش كليدي در درك عملكرد و تنظيم فعاليت‌هاي زيستي مولكول‌هاي RNA ايفا مي‌كند. با وجود پيشرفت روش‌هاي كلاسيك مبتني بر كمينه‌سازي انرژي آزاد، دقت اين رويكردها در حدود 80 درصد باقي مانده و همچنين در مواجهه با ساختارهاي پيچيده مانند گره‌هاي كاذب (Pseudoknots) با محدوديت‌هاي جدي روبه‌رو هستند. در اين پروژه، مدل CNN به عنوان يك رويكرد مبتني بر يادگيري عميق براي پيش‌بيني ساختار دوم RNA ارائه شده است. اين مدل با استفاده از يك بازنمايي تصويرگونه دوبعدي، توالي RNA را به يك تنسور 17 كاناله تبديل كرده و سپس با بهره‌گيري از معماري تمام‌كانولوشني U-Net، الگوهاي محلي و تعاملات دوربرد ميان نوكلئوتيدها را استخراج مي‌كند. اين طراحي امكان مدل‌سازي مستقيم انواع جفت‌شدگي شامل جفت‌هاي استاندارد واتسون-كريك و جفت‌هاي غيركلاسيك را فراهم مي‌سازد. نتايج تجربي نشان مي‌دهد كه مدل پيشنهادي با دستيابي به امتياز F1 حدود 91.0، عملكردي به‌مراتب بهتر از روش‌هاي پيشين داشته و بهبود 5 تا 27 درصدي نسبت به روش‌هاي state-of-the-art ارائه مي‌دهد. همچنين اين مدل در شناسايي گره‌هاي كاذب به نرخ بازخواني حدود 99 درصد دست يافته است. از نظر كارايي محاسباتي، زمان استنتاج مدل حدود 160 ميلي‌ثانيه براي هر توالي گزارش شده كه نشان‌دهنده سرعت و مقياس‌پذيري بالاي آن در مقايسه با روش‌هاي مبتني بر برنامه‌نويسي پويا است. علاوه بر اين، استفاده از داده‌افزايي مصنوعي موجب افزايش توانايي تعميم‌پذيري مدل شده و امكان پيش‌بيني ساختار RNA در خانواده‌هاي ناشناخته و داده‌هاي خارج از توزيع آموزشي را فراهم كرده است.
  • كليدواژه ها
    پيش بيني ساختار RNA , يادگيري عميق , شبكه عصبي كانولوشني , U-Net , ساختار دوم RNA , گره هاي كاذب