شماره ركورد
10345
پديد آورنده
علي عليزاده
عنوان
ارائه ي رويكردي مبتني بر يادگيري عميق براي پيش بيني ساختار ريبونوكلئيك اسيد (RNA)
مقطع تحصيلي
كارشناسي
رشته تحصيلي
مهندسي كامپيوتر
سال فارغ التحصيلي
1405
استاد راهنما
دكتر رضا انتظاري-ملكي
دانشجوي وارد كننده اطلاعات
علي عليزاده
تاريخ ورود اطلاعات
1405/03/02
دانشكده
مهندسي كامپيوتر
عنوان به انگليسي
A deep learning–based approach for predicting the structure of ribonucleic acid (RNA)
چكيده
پيشبيني ساختار دوم RNA از روي تواليهاي نوكلئوتيدي يكي از مسائل بنيادي و چالشبرانگيز در بيوانفورماتيك محاسباتي است كه نقش كليدي در درك عملكرد و تنظيم فعاليتهاي زيستي مولكولهاي RNA ايفا ميكند. با وجود پيشرفت روشهاي كلاسيك مبتني بر كمينهسازي انرژي آزاد، دقت اين رويكردها در حدود 80 درصد باقي مانده و همچنين در مواجهه با ساختارهاي پيچيده مانند گرههاي كاذب (Pseudoknots) با محدوديتهاي جدي روبهرو هستند.
در اين پروژه، مدل CNN به عنوان يك رويكرد مبتني بر يادگيري عميق براي پيشبيني ساختار دوم RNA ارائه شده است. اين مدل با استفاده از يك بازنمايي تصويرگونه دوبعدي، توالي RNA را به يك تنسور 17 كاناله تبديل كرده و سپس با بهرهگيري از معماري تمامكانولوشني U-Net، الگوهاي محلي و تعاملات دوربرد ميان نوكلئوتيدها را استخراج ميكند. اين طراحي امكان مدلسازي مستقيم انواع جفتشدگي شامل جفتهاي استاندارد واتسون-كريك و جفتهاي غيركلاسيك را فراهم ميسازد.
نتايج تجربي نشان ميدهد كه مدل پيشنهادي با دستيابي به امتياز F1 حدود 91.0، عملكردي بهمراتب بهتر از روشهاي پيشين داشته و بهبود 5 تا 27 درصدي نسبت به روشهاي state-of-the-art ارائه ميدهد. همچنين اين مدل در شناسايي گرههاي كاذب به نرخ بازخواني حدود 99 درصد دست يافته است. از نظر كارايي محاسباتي، زمان استنتاج مدل حدود 160 ميليثانيه براي هر توالي گزارش شده كه نشاندهنده سرعت و مقياسپذيري بالاي آن در مقايسه با روشهاي مبتني بر برنامهنويسي پويا است.
علاوه بر اين، استفاده از دادهافزايي مصنوعي موجب افزايش توانايي تعميمپذيري مدل شده و امكان پيشبيني ساختار RNA در خانوادههاي ناشناخته و دادههاي خارج از توزيع آموزشي را فراهم كرده است.
كليدواژه ها
پيش بيني ساختار RNA , يادگيري عميق , شبكه عصبي كانولوشني , U-Net , ساختار دوم RNA , گره هاي كاذب