Руководитель Центра системной биоинформатики Томского научно-исследовательского медицинского центра (ТНИМЦ) Павел Ямщиков рассказал, как биоинформатика помогает раскрывать настоящие тайны генома и о каких значительных объемах данных идет речь.
Начнем с того, что такое бионинформатика? Сегодня это — своего рода стратегический инструмент, без которого невозможны фундаментальные открытия в области геномики и их трансляция в клиническую практику. Биоинформатика позволяет проанализировать большие объемы данных, которые получают ученые. Эта наука позволяет анализировать геном, а также выявлять мутации отдельных генов.
«От анализа вариаций до предсказания эффективности терапии — все это работа вычислительных методов, без которых мы бы оставались на уровне догадок», — рассказал Ямщиков.
Центр системной биоинформатики, в котором трудится Павел Ямщиков, работает с огромными объемами данных. Это не просто цифры и статистика, а материал для анализа и научных выводов. В работе с таким количеством данных биоинформатика существенно экономит время ученых. Если раньше на анализ геномных данных уходили целые недели, потому что ученые были ограничены вычислительными мощностями и недостаточной автоматизацией, то теперь эта работа занимает около суток.
Сейчас Центр системной биоинформатики развивает следующие направления:
- молекулярные механизмы молодого рака — выявление специфических транскрипционных сигнатур;
- разработка мРНК-вакцин против онкологических заболеваний;
- исследование механизмов, связанных с эффективностью химиотерапии, с целью разработки персонализированных подходов к лечению.
Когда ученые говорят, что исследуют огромные объемы данных, то они совсем не преувеличивают. Один полногеномный анализ в среднем требует порядка 100-150 ГБ данных. А иногда речь идет о десятках и сотнях пациентов и, соответственно, о десятках терабайт информации. Такие объемы требуют значительных вычислительных мощностей и четко выстроенных аналитических процессов.
Напомним, что с сентября этого года в ТНИМЦ начнет работать первая в России программа магистратуры по биоинформатике с акцентом на изучение отдельных клеток. Обучение будет проходить в три этапа, а выпускники смогут продолжить карьеру в сфере биоинформатики, в том числе, с применением нейросетей.