Новости

Артефакты NGS: мотив-специфичные ошибки секвенирования

Мотив-специфичные ошибки – это ошибки определения оснований, связанные с конкретными паттернами последовательностей. При секвенировании второго поколения такие ошибки возникают в определённых участках ДНК и особенно характерны для повторяющихся или сложных мотивов, таких как гомополимеры и специфические триплеты (например, GGT). Эти ошибки зачастую можно встретить на платформах секвенирования, использующих оптическое или хемилюминесцентное определение нуклеотидов, где систематические погрешности могут зависеть от нескольких факторов. К ним относятся: особенности работы ДНК-полимеразы, состав иных реагентов секвенирования путём синтеза, алгоритмы обработки сигналов.

Точность считывания флуоресценции очень важна для качества определения оснований. В процессе секвенирования, если определённый триплет вызывает неравномерное включение нуклеотидов или нестабильность флуоресцентного сигнала, это приводит к высокой частоте ошибок на этих участках. Проблема наблюдается в разных платформах секвенирования, и выраженность ошибки может варьироваться в зависимости от конкретной модели секвенатора, что свидетельствует о различиях в аппаратных и программных решениях. Например, ученые из США определили 10 триплетов, в которых ошибки встречаются наиболее часто и показали, что платформы HiSeq 2500 и MiSeq демонстрируют больше всего таких мотив-специфичных ошибок относительно других секвенаторов Illumina. Напротив, секвенатор NovaSeq 6000 в большей части выбранных триплетов демонстрирует лучшие результаты. А группа учёных из Китая показала, что эффективность секвенирования гомополимеров на платформах MGISEQ-200, MGISEQ-2000 и NextSeq 2000 снижалась с увеличением длины гомополимера, сопровождаясь ростом ошибок в определении их длины. MGISEQ-2000 и NextSeq 2000 показали схожую точность, тогда как MGISEQ-200 продемонстрировала значительно заниженные частоты для 8-нуклеотидных поли-G.

Как уже было сказано, на качество прочтений влияет состав реагентов для секвенирования. При разработке OncoScope™ NSCLC Solution мы столкнулись со следующим эффектом. Участок хромосомы 2 – часть гена ALK попадает в регион низкого качества при использовании набора набора MiSeq Reagent Kit v2 и не попадает при использовании набора MiSeq Reagent Kit v3. Всё дело в том, что этот участок имеет высокий GC-состав и небольшие повторяющиеся мотивы, что, по всей видимости, затрудняет секвенирование с использованием некоторых реагентов для секвенирования. На приведённых ниже изображениях видно, что большая часть обратных прочтений при использовании MiSeq Reagent Kit v2 обрывается, не доходя до края фрагмента. На этот регион приходится ряд клинически значимых вариантов в гене ALK: E1210K, S1206Y, S1206C, D1203N, G1202R. Таким образом, систематические ошибки секвенирования могут сказываться на качестве клинически значимой информации.
Рисунок 1 Покрытие участка гена ALK при использовании набора MiSeq Reagent Kit v2
Рисунок 1 Покрытие участка гена ALK при использовании набора MiSeq Reagent Kit v3

Минимизировать влияние мотив-специфичных ошибок на результаты секвенирования, помогут:

Фильтрация и коррекция данных. Использование алгоритмов тримминга и выравнивания помогает не только улучшить общее качество данных, но и скорректировать частые мотив-специфичные ошибки, которые могут возникать на определённых участках последовательности. Современные алгоритмы могут учитывать особенности этих ошибок и применять статистические методы для их исправления, что делает результаты секвенирования более точными.

Использование дополнительных технологий. Гибридные подходы, например, объединение данных коротких и длинных ридов, помогают устранить ошибки, связанные с особенностями считывания на определённых участках. Данные, полученные с помощью других платформ секвенирования, могут быть использованы для уточнения проблемных регионов, тем самым улучшая общую картину и повышая точность результатов.

Мотив-специфичные ошибки воспроизводятся для всех образцов, секвенируемых в одинаковых условиях, поскольку являются ограничением метода. По этой причине необходимо проведение верификации и клинической валидации продуктов для NGS-секвенирования на разных приборах с подробным описанием всех ограничений
2025-02-28 19:19 Блог