
Полный геном за $200 и его анализ в домашних условиях: форматы файлов, откуда берутся и что значат. Часть 2
inetstar 14 минут назад Полный геном за $200 и его анализ в домашних условиях: форматы файлов, откуда берутся и что значат. Часть 2 Простой 13 мин 771 Блог компании RUVDS.com Биотехнологии Биология Научно-популярное...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Значимый прорыв формирует отрасль ИИ: inetstar 14 минут назад Полный геном за $200 и его анализ в домашних условиях: форматы файлов, откуда берутся и что значат. Часть 2 Простой 13 мин 771 Блог компании RUVDS. com Биотехнологии Биология Научно-популярное Туториал Разбираемся, что за файлы выдаёт полногеномное секвенирование и как оно вообще устроеноВ прошлой статье я рассказал, как получил Starter Kit для сбора материалов для секвенирования и отправил его в США.
А также о встроенном в Nebula функционале для его анализа. В этой статье я приведу минимальную базу о том, как выполняется секвенирование, а потом разберём типы и содержание конкретных файлов, полученных мной от Nebula. База базоваяГеном — это длинный текст в алфавите из четырёх букв: A, T, G, C.
Технические детали
Каждая буква — это нуклеотид, «кирпичик» ДНК; длину генома биологи меряют в парах нуклеотидов (каждому нуклеотиду соответствует парный, такой вид резервного копирования в ДНК, далее п. ), потому что ДНК двухцепочечная и каждый нуклеотид представлен парой. Дальше я для простоты зову их буквами: геном — текст, а секвенирование — считывание этих букв из ДНК в файл.
Как машина вообще читает ДНКРасскажу на примере доминирующей технологии — секвенаторов Illumina. Сначала — копии на стеклеФрагмент ДНК попадает на проточную ячейку — стеклянную пластину, густо засеянную короткими синтетическими зацепками, к которым ДНК прилипает концом. Дальше из одной молекулы делают тысячи копий, и делают их прямо на стекле.
Механизм называется мостиковой амплификацией. Амплификация — это размножение, наработка множества копий; делают её средствами ПЦР, только здесь весь процесс протекает прямо на поверхности стекла. Молекула цепляется за зацепку, ДНК-полимераза достраивает её копию, а исходную нить смывают.
Отраслевые последствия
Оставшаяся копия изгибается дугой, дотягивается свободным концом до соседней зацепки, полимераза копирует её через этот «мостик», две нити разъединяют — и копий уже две. Цикл повторяется, число копий удваивается раз за разом. Та же логика, что в ПЦР-тесте на вирус: берут несколько фрагментов вирусного генома и экспоненциально размножают, пока из неуловимых единиц не выйдут миллиарды, которые уже видит прибор.
Разница в том, что обычная ПЦР идёт в пробирке и копии плавают вперемешку, а здесь она приклеена к стеклу. Каждая новая копия дотягивается только до зацепок в паре микрон от себя, поэтому все потомки одной молекулы остаются в одном крошечном пятне — клональной колонии. Разные исходные молекулы садятся далеко друг от друга, и их кластеры не смешиваются.
У каждого кластера выходит свой адрес на стекле — координаты X и Y, как у пикселя на матрице. Схема: из одной молекулы ДНК мостиковой амплификацией получается кластер из тысяч копий, дающий яркую точку для камерыЗачем вообще тысяча копий? Одна молекула с одной светящейся меткой для камеры слишком тускла.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





