Исследователи выбирают NGS-платформу, исходя из своих задач, однако есть лаборатории, в которых работают секвенаторы разных производителей. Наборы реагентов для подготовки библиотек, как правило, совместимы только с одной платформой, хотя этапность протоколов принципиально не различается. Российская компания Parseq Lab решила эту проблему в своей линейке Prep&Seq™, разделив одну коробку с реагентами на несколько модулей.
Генеральный директор компании Александр Павлов рассказывает о том, какими приборами будут оснащены российские NGS-лаборатории в ближайшем будущем, как выполняется дизайн панели праймеров для таргетного секвенирования и с какими сложностями связана регистрация NGS-тестов для медицинского применения.
Генеральный директор Parseq Lab Александр Павлов. Credit: Parseq Lab
«Во всех протоколах пробоподготовки к секвенированию реализуются одни и те же стадии»
Какие платформы для секвенирования популярны среди российских ученых?
Исторически платформа Ion Torrent первой распространилась в стране благодаря деятельности представителей компании Thermo Fisher Scientific. Именно Ion Torrent с 2012 по 2016 годы была той самой платформой, на которой проводили основную часть NGS-исследований. В 2015–2016 годах Illumina стали использовать чаще. Я думаю, что около 30% исследований делается на Ion Torrent. В последний год тенденция немного меняется, Thermo Fisher снова устанавливает все больше приборов, но пока что преимущество за Illumina. И подпирают китайские производители со своими платформами. В нескольких учреждениях они уже работают. Этот баланс будет постепенно смещаться в сторону диверсификации, все больше лабораторий оснащают несколькими платформами под разные задачи. И в этих лабораториях будут использоваться самые разные наборы для пробоподготовки.Какие решения для подготовки библиотек сейчас доступны российским пользователям Illumina и Ion Torrent?
Основные производители — это Thermo Fisher Scientific и Illumina. Те, кто работают на платформе Thermo Fisher Scientific, используют большое разнообразие оригинальных панелей, пробоподготовки и сопутствующих реагентов, но не могут использовать панели, разработанные под Illumina. Тогда как у Illumina есть своя ограниченная адаптация реагентов Thermo Fisher Scientific. Тут как раз интересно то, что мы делаем.В чем преимущество наборов Prep&Seq™?
В первую очередь это кросс-платформенность. Во всех протоколах пробоподготовки к секвенированию реализуются одни и те же стадии. Для таргетного секвенирования это таргетное обогащение, дальше — лигирование адаптеров, пришивание индексов, вторая ПЦР. Все стадии до лигирования адаптера являются общими для разных платформ. Неважно, как вы делаете таргетное обогащение, потому что специфичность платформы определяется именно адаптерами. Мы разработали такую пробоподготовку, которая позволяет адаптировать протокол под разные платформы. Это модульная система, в состав которой включены базовые реагенты для таргетного обогащения и дополнительные модули. Базовые реагенты позволяют сегодня работать на системе Illumina, завтра — на Ion Torrent, послезавтра — на MGI. После таргетного обогащения вы можете выбирать способ пришивания адаптера и молекулярного баркодирования/индексирования — такая гибкость заложена за счет дополнительных модулей. Есть и вспомогательные реагенты для проведения второй обогащающей ПЦР и очистки ПЦР-продуктов, то есть все, что нужно, чтобы из образца ДНК получить библиотеку и загрузить на секвенатор.Поставки от Parseq Lab приходят быстрее, чем от зарубежных производителей?
Конечно. Мы знаем про эту боль: зарубежные реагенты едут долго, сложно и дорого. Поэтому мы фиксируем цену в рублях и существенно сокращаем срок поставки. Бывало, что мы отгружали буквально на следующий день. Это здорово, потому что некоторые эксперименты не ждут, их нужно сделать сейчас.Вы планируете делать пробоподготовку для китайских секвенаторов?
Обязательно! Мы не можем остаться в стороне. Сейчас пробоподготовка под платформы Illumina и Ion Torrent уже на рынке, а дополнительные модули для работы с платформой MGI мы готовим к выходу. Они уже разработаны и протестированы. Поэтому эта система будет по-настоящему кросс-платформенной. Единственная на рынке! Наши клиенты смогут использовать одни и те же панели на разных платформах, в зависимости от своей задачи. Панель обеспечивает специфичность исследования, а платформа задает остальные характеристики.Credit: архив Parseq Lab
«Панель — это не просто реагенты, это система, которая решает конкретную задачу»
Давайте поговорим об отдельных модулях Prep&Seq™. Вы предлагаете кастомизированную панель U-panel. Как родилась эта идея?
Мы апологеты мультиплексной ПЦР, используем эту технологию с 2012 года. Она достаточно универсальная, может работать со следовыми количествами исходной ДНК. В криминалистике это буквально след пальца, оставленный на поверхности, откуда можно собрать какие-нибудь 15 пг ДНК. Поэтому в основе всей нашей таргетной пробоподготовки лежит метод мультиплексной ПЦР. Полтора-два года назад мы задумались о собственном инструменте для подбора праймеров в панели. Разработка заняла год. Мы получили биоинформатический алгоритм, который позволяет по заданным регионам в геноме подобрать минимальное количество специфических праймеров так, чтобы ампликоны покрывали заданные регионы. Алгоритм валидировали на реальных образцах, на международных стандартах, на панелях разного формата. Использовали и геномную ДНК, и деградированную ДНК, и ДНК из растительных источников. Когда мы поняли, что алгоритм адекватно работает и даже превосходит зарубежные аналоги, мы решили, что он может быть интересным предложением для российского пользователя.Как происходит взаимодействие с клиентом и дизайн праймеров?
На данном этапе дизайн выглядит так: пользователь заполняет опросник, в котором указывает основные желаемые технические характеристики. Например, длину ампликона. Если эта панель предназначена для работы с интактной геномной ДНК на платформе Illumina, длина ампликона может быть от 250 до 375 нуклеотидов. Если это работа с деградированной ДНК, образцы циркулирующей ДНК или образцы, которые используются в криминалистике, можно уменьшить размеры фрагментов до 125–175 нуклеотидов. Также в опроснике указываются регионы интереса и специфические точки — хот-споты, те локусы в геноме, которые очень важны для пользователя. Например, для медико-генетических научных исследований очень важно, чтобы были покрыты распространенные патогенные варианты. В любой пробоподготовке есть ограничения, и если в эти ограничения попадет суперважный хот-спот, информативность панели будет снижена. Дальше мы верифицируем данные. Если все в порядке, запускаем алгоритм. Он трудится, это достаточно сложный, ресурсоемкий процесс, он может занимать не один день, если панель большая. Это полностью автоматизированная процедура. После того, как получили результат, проводим валидациюin silico. Особое внимание уделяется сложным регионам и тем, в которых есть хот-споты. Некоторые регионы можно покрыть дополнительно вручную: не снижая общей специфичности панели, добавить праймеры, которые алгоритмом были исключены или просто не были «задизайнены». После валидации in silico мы сообщаем клиенту о покрытии регионов интереса, обычно это не меньше 98%.
Что может повлиять на покрытие?
Покрытие очень сильно зависит от гена. В панели могут быть гены с псевдогенами, высокогомологичные области или повторы. Это очень сложные регионы, не только для дизайна и секвенирования, но в принципе для ПЦР. Полимераза не любит повторы, она постоянно там запинается и делает ошибки. Такие области попадают в ограничения, но мы всегда дожимаем до последнего. Если на этот регион можно в принципе сделать праймер, мы это делаем. Если этого нельзя сделать, например, это высокогомологичный регион, где будет нулевая специфичность праймеров и ампликонов, то праймеры туда размещать нет смысла.В каком виде панель отправляются пользователю?
Если дизайн согласован, мы синтезируем праймеры и при помощи роботизированной системы объединяем их в пулы в определенных пропорциях. На выходе получаются 1–2 пробирки. После этого мы проводим еще и in vitro валидацию панели на международных полногеномных стандартных образцах, чем отличаемся от наших конкурентов. Этому обычно никто не уделяет внимания, но мы считаем, что панель — это не просто реагенты, это система, которая решает конкретную задачу. Мы готовим библиотеки, секвенируем их так же, как это будет происходить у пользователя, на платформе Illumina или Ion Torrent. После этого готовится финальный отчет, где мы указываем долю прочтений, приходящихся на целевые регионы, и однородность панели. Чем более однородна панель, тем меньше вы можете позволить себе прочтений, чтобы получить заданный уровень покрытия. Если панель обладает высокой неоднородностью, придется сильно увеличивать покрытие на образец. Некоторые регионы будут чрезвычайно перепокрыты, а некоторые — едва покрыты, это плохо. В наших панелях обычно однородность держится на уровне 95–98%. В ближайших планах у нас — максимально автоматизировать процесс формирования задания на дизайн панели. Это будет происходить через интерактивный интерфейс: ученый загрузит данные в отдельную форму, валидатор проверит корректность этих данных и алгоритм запустится автоматически, без участия наших специалистов. Подобрать праймеры и получить реагенты для своего проекта станет очень просто.Разработка кастомизированной панели U-Panel. Credit: Parseq Lab
Можете ли вы разработать для пользователя панель «с нуля»?
Если клиент говорит: «я хочу получить тест-систему на наследственное заболевание», не предоставляя нам ни координат, ни горячих точек, — это не кастомизированная панель. Это сервис по разработке готового решения. При заказе кастомизированной панели пользователь к нам приходит, уже зная, что он хочет посмотреть. Идеально, когда он называет регионы интереса. Но возможен вариант, когда нам говорят, что нужны все экзоны и UTR определенных генов.Какие самые необычные панели у вас заказывали?
Мы делали панель для агрогеномики. Задача была в определении сортовой принадлежности для контроля и паспортизации объектов. ДНК объекта выделялась как из семян, так и из листьев. При этом в техзадании у нас был запрос на совместимость этой панели с генетическим материалом, выделенным из готового продукта, который производится из этого растения. Вообще все панели очень разные. Мы ждем, что клиенты нам подкинут еще какие-то интересные задачки.Кто к вам приходит за кастомизированными панелями?
Наши таргетные панели, реагенты и тест-системы продаем и российским пользователям, и зарубежным. В России это медико-генетические центры, научно-исследовательские институты, ведомственные учреждения, частные компании. Мы также активно работаем с Турцией и Италией. В Италии это в основном медико-генетические центры, которые проводят молекулярно-генетические исследования новорожденных на наследственные заболевания. У них глубокая интересная программа неонатального скрининга, более обширная, чем у нас в стране, и молекулярно-генетические тестирования — один из важных этапов постановки дифференциального диагноза.Credit: архив Parseq Lab
«Вся пробоподготовка — это совокупность артефактов»
Вы предлагаете включать в панели биологический идентификатор — BID. Что это такое?
Идея внутреннего контроля качества пришла, когда мы плотно занимались вопросами идентификации образцов — в основном в криминалистических целях. В каждую нашу панель мы добавляем 13 ампликонов: десять на аутосомы и три, отвечающие за определение пола, на половые хромосомы. Эти ампликоны покрывают определенные регионы в геноме, в которых мы умеем позиционировать точечные варианты. Некоторые варианты в популяции распространены в виде так называемых микрогаплоблоков. Такие маркеры высокополиморфны и при этом просты для ПЦР и секвенирования. Мы используем микрогаплоблоки как идентификатор образца. Практически каждый образец имеет собственный набор этих биологических идентификаторов. BID — это способ контроля качества исследования. Фактически это стоит недорого — если у вас панель на 500 ампликонов, то добавление еще тринадцати не сильно изменит ее размеры, стоимость и сложность, но даст расширенные возможности для контроля качества.Каких ошибок помогает избежать BID?
Если на фоне генотипа одного образца мы видим три аллели в одном локусе, этот образец должен быть отбракован. Если вы, например, ставите один образец два раза, и у них не совпадает генотип по этим полиморфным регионам, то, скорее всего, это разные образцы. Это лабораторный контроль качества на преаналитическом этапе, что очень важно, потому что большинство лабораторных проблем происходят именно на преаналитическом этапе. Также вы можете при помощи этих маркеров определить родство. Например, вы анализируете трио, определяете информативность семьи, но оказывается, что это не родственники. Наконец, не всегда пол, который указан в анкете, совпадает с биологическим полом. Здесь тоже есть разные причины. Самая очевидная — перепутывание образцов. В редких случаях биологический пол не совпадает с фенотипическим.Какие преимущества дают дополнительные модули с индексированными адаптерами и праймерами?
Стратегия у всей пробоподготовки преследует одну цель — создание библиотеки с заданными параметрами, которая может быть загружена на секвенатор. Библиотека должна отвечать трем основным условиям: быть нужной длины, содержать адаптер — техническую последовательность, которая садится на поверхность твердой фазы и с которой потом идет секвенирование, и молекулярный маркер — баркод в случае платформы Ion Torrent либо индекс в случае платформы Illumina. Мы реализовали два подхода в этой стратегии. Первый — человек может сразу пришить универсальный адаптер к ампликону и дальше уже индексировать при помощи праймеров. Второй — клиент пришивает индексированный адаптер, и вторая ПЦР либо проводится, либо этап пропускается и процесс идет по протоколу PCR-free. В этом протоколе мы убираем один из этапов, который плодит артефакты. В принципе, вся пробоподготовка — это совокупность артефактов. Поэтому в некоторых случаях избавление от этапов пробоподготовки — это безусловное добро. Мы стараемся минимизировать этапность пробоподготовки. Индексированные адаптеры поставляются в нескольких форматах. У нас есть «пробирочный» формат и «планшетный» — пользователь получает готовый планшет, запаянный в фольгу. В лаборатории он открывает планшет и просто вносит свои образцы. Это удобно для высокопотоковых исследований, снижает количество ошибок, ускоряет процессы. Сейчас мы можем проводить индексирование до 768 индивидуальных образцов.Схема подготовки библиотек для таргетного и полногеномного секвенирования с помощью продуктов Parseq Lab. Базовый модуль Prep&Seq™ G-fragmentation появится в портфолио компании до конца года. Credit: Parseq Lab