چکيده
امروزه با رشد سريع دادههاي بيوانفورماتيكي روشهاي يادگيري ماشين در زمينههاي متعددي از بيوانفورماتيك كاربرد يافتهاند. ژنوميك يكي از حوزههاي بسيار مهم بيوانفورماتيك است كه با ظهور تكنولوژي «توالييابي نسل جديد» تعداد دنبالههاي موجود در آن بصورت نمايي در حال افزايشند. در گذشته براي تحليل اين دنبالهها نياز به دانش و مطالعات پايهاي براي توصيف آنها بود.
با استفاده از مدلهاي يادگيري ماشين ميتوان هر دنبالهي زيستي را بصورت يك بردار n بعدي كه خصوصيات بيوفيزيكي و بيوشيميايي آن را مشخص ميكند بازنمايي كرد. كه اين بازنمايي را ميتوان در طيف گستردهاي از مسائل بيوانفورماتيك نظير دستهبندي پروتئينها و تشخيص ساختار به كار برد. مزيت ديگر اين نوع بازنماييها اينست كه اين بردارها يك بار ياد گرفته شده و پس از آن درهر مسئلهي ديگري براي بازنمايي دنبالهها استفاده ميشوند. به همين انگيزه در اين گزارش به بررسي انواع روشهاي بازنمايي برداري دنبالههاي زيستي(دنبالههاي پروتئيني و ژنوم) پرداخته و تاثير به كارگيري اين بردارها در پارهاي از عمليات حوزهي بيوانفورماتيك نظير «انطباق دنبالهها» و «توالييابي» را نشان خواهيم داد.