Эдуард Сероусов – Код Хейфлика (страница 8)

18

«Рейчел, данные во вложении. Интересный материал – у меня в процессе прогона возник вопрос по методологии, напишу отдельно. Маркус».

Вопрос по методологии она прочла позже. Сначала – данные.

Она запустила выравнивание. Пока алгоритм работал, она сидела прямо, почти не двигаясь, и смотрела на прогресс-бар с тем особым вниманием, которое ничего не означает и ни на что не влияет, но которое невозможно остановить.

Результат занял девятнадцать минут.

Рейчел смотрела на экран.

Морские ежи. Strongylocentrotus purpuratus. Другое надцарство, другая секвенационная платформа, другая лаборатория, другой исследователь. Теломерная биохимия, отличающаяся от хордовых в нескольких деталях.

Решётка была.

Не точно такая же – позиции сдвинуты пропорционально разнице в длине теломерного повтора у этого вида. Это было ожидаемо, если паттерн системный. Это было именно тем, что системный паттерн должен делать в разных геномах: адаптироваться к архитектуре носителя, сохраняя структурное отношение.

Рейчел встала. Прошла к окну. Постояла.

Три контрольных набора. Три разные лаборатории. Три разных секвенатора – Illumina, Oxford Nanopore, Pacific Biosciences. Виды из четырёх основных эволюционных ветвей: грибы, растения, беспозвоночные, позвоночные. Паттерн воспроизвёлся во всех трёх наборах, с поправками, соответствующими известным различиям в теломерной архитектуре между видами.

Это воспроизводимо.

Это не артефакт.

Она написала Ннамди: «Третий набор. Маркус Фальк, ETH Цюрих, морские ежи, PacBio. Паттерн есть. Адаптирован к геному, но структурно идентичен».

Ответ пришёл через две минуты. Одно слово:

«Знаю».

Потом, через тридцать секунд:

«Т.е. нет, не знаю – откуда знаю. Просто знал, что так и будет».

Потом:

«Что делаем дальше?»

Что делать дальше – этот вопрос она уже думала. Не в смысле следующего эксперимента, а в смысле более широком, который пока не хотелось формулировать прямо. Но прежде чем думать об этом, ей нужен был ещё один ответ.

Ответ на вопрос, который она поставила себе ещё в январе, у реки: откуда это.

Датировка.

Молекулярные часы – инструмент несовершенный и любимый одновременно. Идея проста: мутации накапливаются с приблизительно постоянной скоростью, поэтому по количеству различий между двумя последовательностями можно оценить время их расхождения. Проблем у этого метода несколько: скорость накопления мутаций варьирует между ветвями и зависит от поколения, методы калибровки несовершенны, и результат всегда имеет широкий доверительный интервал. Но для грубой оценки – когда тебе важен порядок величины, а не точная цифра – молекулярные часы дают то, что нужно.

Рейчел хотела знать, когда появились модифицированные нуклеотиды в этих позициях. Не когда возникли теломеры как таковые – это другой вопрос. Когда именно эти конкретные модификации оказались там, где они есть, и начали воспроизводиться из поколения в поколение неизменными.

Методически это было нетривиально. Стандартные молекулярные часы работают с заменами нуклеотидов в кодирующих или некодирующих последовательностях, но не с модификациями – эпигенетическими пометами, которые накладываются поверх последовательности. Рейчел разработала адаптированный протокол: использовать консерватизм самих позиций как точку калибровки, а затем по паттерну накопленных нейтральных мутаций вокруг этих позиций оценить, как давно сами позиции стали консервативными.

Это было косвенно. Это давало широкий интервал. Это было единственным, что она могла сделать с имеющимися данными.

Она работала над протоколом восемь дней. Проверила его на модельных данных – синтетических последовательностях с заданным возрастом консерватизма. Метод давал интервал с погрешностью около 15%. Для её целей – достаточно.

Она запустила анализ на реальных данных в воскресенье вечером. Ушла домой. Вернулась в понедельник.

Результат был на экране, когда она пришла. Она не открывала его сразу – сначала повесила куртку, включила кофемашину, сказала доброе утро Линь, которая уже сидела за своим столом. Потом подошла к своему рабочему месту. Открыла ноутбук.

Верхняя строка результата:

Опишите проблему X