Обложка канала

Nplus1

35195 @nplusone

Главное российское издание о науке и технологиях.

Nplus1

3 года назад
Открыть в
Всего год назад генетики закончили собирать полный геном человека, но отдыхать некогда — время собирать пангеном. Это ветвистый граф, который должен изображать последовательность нуклеотидов в человеческой ДНК со всеми возможными вариантами нормы. Консорциум, который взялся за эту задачу, поставил своей целью собрать 350 разных геномов. Пока получилось собрать 47 — и об этой работе Консорциум отчитался в трех статьях. Ученые воспользовались 18 образцами, которые раньше уже были отсеквенированы в ходе других исследований, и отобрали еще 29 образцов из базы проекта «1000 геномов». При этом ученые старались добиться максимального разнообразия в своей выборке: они подсчитали генетическое расстояние между 2504 образцами в базе данных и выбрали представителей каждой субпопуляции, которые находятся дальше всего от других субпопуляций. В результате в пангеном попали представители Африканского континента, а еще Азии, Европы и обеих Америк. Каждый образец отсеквенировали с использованием технологий Oxford Nanopore и PacBio Hi-Fi. Кроме того, в каждом случае генетики использовали сиквенсы генома обоих родителей, чтобы точнее восстановить последовательность. Затем все 47 сиквенсов собрали в единый пангеном — тремя разными методами, поскольку общепринятого алгоритма для сборки пангеномов пока нет. Ученые подсчитали вариации в пангеноме: в одном из вариантов сборки нашлось 22 миллиона маленьких вариаций (длиной меньше 50 нуклеотидов) и 67 тысяч структурных вариаций (длиннее 50 нуклеотидов), в другом варианте — 21 миллион и 73 тысячи соответственно. Потом исследователи проверили, насколько хорошо их пангеном решает задачу поиска небольших вариаций в геноме отдельных людей. Они взяли данные из еще одного предыдущего исследования и наложили короткие фрагменты сиквенса (риды; то, из чего потом с помощью алгоритмов собирают полный геном) на свой пангеном и на референс GRCh38. В случае с пангеномом получилось 21700 ошибок (как ложноположительных, так и ложноотрицательных), а с GRCh38 их вышло 29–36 тысяч в зависимости от алгоритма. Во второй статье, посвященной пангеному, исследователи сосредоточились на сегментных дупликациях — мутациях, в ходе которых большие фрагменты ДНК удваиваются и мигрируют. Они составили карту донорных и акцепторных участков, в которых это происходит, и подсчитали, какие точечные мутации возникают в таких повторах.  Третья статья рассказывает о коротких плечах акроцентрических хромосом (то есть таких, у которых плечи сильно неравномерны по длине) — 13, 14, 15, 21 и 22. Авторы этой статьи нашли в них практически идентичные участки и предположили, что из-за этого хромосомы до сих пор продолжают рекомбинировать и обмениваться последовательностями.