-
شماره ركورد
22003
-
شماره راهنما(اين فيلد مربوط به كارشناس ميباشد لطفا آن را خالي بگذاريد)
22003
-
پديد آورنده
سيده تينا تربالي
-
عنوان
تخمين هاپلوتايپ با استفاده از فاكتورسازي ماتريس رتبه پايين
-
مقطع تحصيلي
كارشناس ارشد
-
رشته تحصيلي
مخابرات - سيستم
-
تاريخ دفاع
1398/7/29
-
استاد راهنما
دكتر محمد حسين كهائي
-
دانشكده
برق
-
چكيده
مسئله تخمين هاپلوتايپ با استفاده از مدل¬سازي ماتريسي در سال¬هاي اخير به عنوان يكي از زمينه¬هاي تحقيقاتي بين رشته¬اي مطرح شده است. به دست آوردن هاپلوتايپ كليد كشف رابطه¬ي بين ژن¬هاي يك فرد و بيماري¬هاي ژنتيكي قلمداد مي¬شود كه منجر به طراحي دارو و روش¬هاي درماني مبتني بر فرد مي-گردد.
خوانش هاپلوتايپ از رشته DNA داراي اطلاعات ناقصي از مجموعه هاپلوتايپي است. تخمين هاپلوتايپ در مسائل NP-hard قرار گرفته است. از طرفي مشاهدات حاصل از نمونه¬برداري را مي¬توان به صورت يك ماتريس رتبه¬پايين مدل كرد كه در آن تنها تعدادي از درايه¬ها مشاهده شده¬اند. در نتيجه يك روش موثر براي بازيابي هاپلوتايپ از مشاهدات ناقص، استفاده از روش¬هاي تكميل ماتريس است.
در اين پژوهش به كمك روش¬هاي تكميل ماتريس، سعي در تخمين هاپلوتايپ از طريق تجزيه¬ي ماتريسي شده¬است. در مراجع از روش گراديان كاهشي براي حل مسئله استفاده شده¬است. اما در روش¬هاي ارائه شده به شروط موجود براي ماتريس¬هاي هاپلوتايپ توجه نشده است و اين موضوع باعث تخمين داده¬هاي پرت براي هاپلوتايپ شده است. در روش پيشنهادي با در نظر گرفتن اين شروط در ماتريس هاپلوتايپ، تابع هزينه جديد به صورت عبارت جريمه براي مسئله بيان مي¬شود. عبارت جديد اضافه شده به تابع هزينه، به تخمين هاپلوتايپ با دقت بيشتر كمك كرده و بازيابي ماتريس نامناسب براي هاپلوتايپ را كاهش داده است. همچنين با استفاده از مفهوم لاگرانژين بهبود¬يافته به عنوان پايه¬ي روش بهينه ADMM، الگوريتم جديدي ارائه شده¬است كه باعث حل مسئله¬ي بهينه سازي و تخمين هاپلوتايپ مي¬شود. نتايج حاصل از شبيه¬سازي كاهش خطاي تخمين هاپلوتايپ را نشان مي¬دهد. نتايج شبيه¬سازي مويد اين مطلب است كه تابع هزينه پيشنهادي و الگوريتم ارائه شده در اين پايان¬نامه با كاهش خطاي تخمين به بازيابي هاپلوتايپ كمك مي¬كند.
-
تاريخ ورود اطلاعات
1399/03/17
-
عنوان به انگليسي
Haplotype estimation using low-rank matrix factorization
-
تاريخ بهره برداري
10/20/2020 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
سيده تينا تربالي
-
چكيده به لاتين
The problem of haplotype estimation using matrix modeling has been raised in recent years as one of the interdisciplinary research areas. Obtaining haplotypes is the key to discovering the relationship between an individual's genes and genetic diseases that lead to the design of medications and individual-based therapies.
Haplotype readings from DNA strands contain incomplete information from haplotype sets. Haplotype estimation is based on NP-hard problems. On the other hand, the sampling observations can be modeled as a low-order matrix in which only a few elements are observed. As a result, an effective way to recover haplotypes from incomplete observations is to use matrix complementation methods.
In this research, we have tried to estimate haplotypes by matrix analysis using matrix complementation methods. In the references, the descending gradient method is used to solve the problem. However, in the proposed methods the conditions for haplotype matrices have not been considered and this has led to the estimation of outliers for haplotype. In the proposed method, taking into account these conditions in the haplotype matrix, the new cost function is expressed as a penalty for the problem. The new term added to the cost function has helped the haplotype estimate more accurately and reduced the recovery of the inappropriate matrix for the haplotype. Also, using the improved Lagrangian concept as the basis of the ADMM optimization method, a new algorithm has been proposed that solves the optimization problem and haplotype estimation. The results of the simulation show the reduction of the haplotype estimation error. The simulation results confirm that the proposed cost function and the algorithm presented in this thesis help to reduce haplotype retrieval by reducing the estimation error.
-
لينک به اين مدرک :