Вопрос по методологии она прочла позже. Сначала – данные.
Она запустила выравнивание. Пока алгоритм работал, она сидела прямо, почти не двигаясь, и смотрела на прогресс-бар с тем особым вниманием, которое ничего не означает и ни на что не влияет, но которое невозможно остановить.
Результат занял девятнадцать минут.
Рейчел смотрела на экран.
Морские ежи.
Решётка была.
Не точно такая же – позиции сдвинуты пропорционально разнице в длине теломерного повтора у этого вида. Это было ожидаемо, если паттерн системный. Это было именно тем, что системный паттерн должен делать в разных геномах: адаптироваться к архитектуре носителя, сохраняя структурное отношение.
Рейчел встала. Прошла к окну. Постояла.
Три контрольных набора. Три разные лаборатории. Три разных секвенатора – Illumina, Oxford Nanopore, Pacific Biosciences. Виды из четырёх основных эволюционных ветвей: грибы, растения, беспозвоночные, позвоночные. Паттерн воспроизвёлся во всех трёх наборах, с поправками, соответствующими известным различиям в теломерной архитектуре между видами.
Это воспроизводимо.
Это не артефакт.
Она написала Ннамди:
Ответ пришёл через две минуты. Одно слово:
Потом, через тридцать секунд:
Потом:
Что делать дальше – этот вопрос она уже думала. Не в смысле следующего эксперимента, а в смысле более широком, который пока не хотелось формулировать прямо. Но прежде чем думать об этом, ей нужен был ещё один ответ.
Ответ на вопрос, который она поставила себе ещё в январе, у реки:
Датировка.
Молекулярные часы – инструмент несовершенный и любимый одновременно. Идея проста: мутации накапливаются с приблизительно постоянной скоростью, поэтому по количеству различий между двумя последовательностями можно оценить время их расхождения. Проблем у этого метода несколько: скорость накопления мутаций варьирует между ветвями и зависит от поколения, методы калибровки несовершенны, и результат всегда имеет широкий доверительный интервал. Но для грубой оценки – когда тебе важен порядок величины, а не точная цифра – молекулярные часы дают то, что нужно.
Рейчел хотела знать, когда появились модифицированные нуклеотиды в этих позициях. Не когда возникли теломеры как таковые – это другой вопрос. Когда именно эти конкретные модификации оказались там, где они есть, и начали воспроизводиться из поколения в поколение неизменными.
Методически это было нетривиально. Стандартные молекулярные часы работают с заменами нуклеотидов в кодирующих или некодирующих последовательностях, но не с модификациями – эпигенетическими пометами, которые накладываются поверх последовательности. Рейчел разработала адаптированный протокол: использовать консерватизм самих позиций как точку калибровки, а затем по паттерну накопленных нейтральных мутаций
Это было косвенно. Это давало широкий интервал. Это было единственным, что она могла сделать с имеющимися данными.
Она работала над протоколом восемь дней. Проверила его на модельных данных – синтетических последовательностях с заданным возрастом консерватизма. Метод давал интервал с погрешностью около 15%. Для её целей – достаточно.
Она запустила анализ на реальных данных в воскресенье вечером. Ушла домой. Вернулась в понедельник.
Результат был на экране, когда она пришла. Она не открывала его сразу – сначала повесила куртку, включила кофемашину, сказала доброе утро Линь, которая уже сидела за своим столом. Потом подошла к своему рабочему месту. Открыла ноутбук.
Верхняя строка результата: