Общество

«Наши внуки будут намного здоровее нас»

06 май

В лаборатории компьютерных технологий НИУ ИТМО, где работает молодой учёный Фёдор Царёв, создали модель для сборки генома человека

Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (НИУ ИТМО) в прошлом году вошёл в число 15 российских вузов, претендующих на место в первой сотне мировых рейтингов. Этому способствуют научные изыскания его перспективных молодых учёных, в том числе лаборатории компьютерных технологий, коллектив которой почти полностью состоит из молодых выпускников университета, ещё в студенческие годы становившихся чемпионами мира по программированию.

– Фёдор, почему вы, специалист по информационным технологиям, вдруг заинтересовались биологией?

– Совсем не вдруг. Я начинал с исследований генетических алгоритмов. Это направление изучает, как можно использовать принцип эволюции живой природы при построении алгоритмов для компьютера. Вот я и пытался научить компьютер писать программы, которые чем-то управляют, например, лифтом или принтером. Мой научный руководитель предложил описывать такие программы в виде конечных автоматов.

Эволюцией природы правит закон естественного отбора: выживает тот организм, который наиболее приспособлен к изменяющимся условиям. А как заставить выживать программы? Для этого нужен механизм изменения, аналогичный существующим в природе механизмам мутации и скрещивания.

Конечный автомат на схеме можно представить как несколько кружочков, обозначающих состояния, которые соединены стрелочками, обозначающими переходы между ними. Переходы от одного состояния к другому происходят при выполнении условий, поступающих от внешней среды и от того, чем управляет программа. Что такое мутация в природе? Небольшое изменение генотипа. В моей задаче генотипом можно считать схему конечного автомата. В природе мутации происходят случайно, и здесь тоже используется принцип случайности. В результате такой «мутации» автомат может получиться существенно лучше или существенно хуже. Но у того, который хуже, меньше шансов продолжить эволюцию.

– Что это даст на практике – думающие компьютеры?

– Построение конечного автомата по его описанию можно поручить программисту, но он способен ошибиться. Можно поручить это построение компьютеру, который не ошибается. Но поскольку думать он не умеет, ему приходится моделировать процесс эволюции, меняя схему. В итоге получается программа, идеально соответствующая описанию. В будущем при построении некоторых управляющих систем это позволит обойтись без программиста.

Мы в лаборатории сейчас работаем над тем, чтобы компьютер сам мог чему-то научиться. Создаём алгоритмы, которые при получении новых данных улучшают свою работу.

– А где же тут биоинформатика?

– В биоинформатике всё наоборот – компьютерные методы применяются для анализа живой природы. Эти исследования начались с того, что мой научный руководитель познакомился с руководителем центра «Биоинженерия» РАН. Выяснилось, что генетикам нужны программы для обработки огромного количества данных. Представьте: геном человека составляет 3 гигабайта информации! А читают его фрагментами, по 100–200 символов, и, чтобы восстановить весь геном, надо читать их несколько десятков раз. Это всё равно что собрать головоломку из миллиарда частей. Вот мы сейчас и занимаемся этой задачей.

Весь процесс восстановления маленьких фрагментов генома в определённой последовательности можно сделать на компьютере. После этого нужно запустить процесс интерпретации, чтобы понять, какая мутация отвечает за то или иное заболевание, и после этого менять участки ДНК. В идеале наша задача – помочь генетикам определить, что и на что именно нужно менять.

– Подождите, но ведь считается, что геном человека расшифрован…

– Это не совсем так. Расшифровали геном среднестатистического человека, но не каждого в отдельности. Между тем все люди отличаются друг от друга на одну десятую процента. У любого есть примерно 30 мутаций, которых ещё ни у кого не было. Так что нам есть над чем работать.

В информатике выделяют два класса задач. Первый – которые можно быстро решить. К ним относится задача математика Леонарда Эйлера о семи мостах Кёнигсберга – как пройти по каждому мосту ровно один раз. Можно построить алгоритм, позволяющий решить задачу для любого числа островов и мостов. Второй класс – задачи труднорешаемые. Например, задача коммивояжёра: как при наличии карты посетить несколько городов, проехав при этом минимальное расстояние. Такие задачи, скорее всего, нельзя быстро решить, но легко быстро проверить правильность их решения.

Для сборки индивидуального генома надо было создать математическую модель, и мы их разработали несколько. Вообще-то задача сборки генома была сформулирована ещё семь лет назад, но до нас её никто не мог решить – она относится к тому самому классу труднорешаемых. Но проблемы остаются. К примеру, имеется разрыв между теоретическими моделями исследований генома и теми, которые используются на практике. Практика теоретически не обоснована, а теоретические изыскания нельзя использовать – будет много работы. Сейчас наша лаборатория старается сократить этот разрыв – разрабатываем новые математические модели сборки генома, исследуем существующие алгоритмы.

– Другими словами, корректировка человеческого генома, о чём пишут в фантастических романах, скоро станет реальностью?

– Скоро – это лет через двадцать. Причём, вероятнее всего, такая коррекция будет производиться ещё в дородовый период. Возможно, наши внуки будут намного здоровее нас. Но пока говорить об этом ещё рано – технология коррекции человеческого генома пока совсем не разработана. А вот модифицировать растения с помощью биоинформатики учёные начнут уже скоро, и это будет гораздо проще, чем раньше. Новые методы будут отличаться от прежних, как ведение бухгалтерии в компьютерной программе Excel от ведения бухучёта по книге. Компьютерные программы облегчат генным инженерам работу с данными.

– Насколько я знаю, сборка генома не единственная тема, которой занимаются сотрудники вашей лаборатории…

– Ещё одна наша тема – мы занимаемся ею совместно с учёными из частного исследовательского университета Вашингтона в Сент-Луисе – системная биология. Ведь геном – только один вид информации о живом организме. Есть ещё белки, обмен веществ… И если на один и тот же процесс смотреть с точки зрения разных видов информации, можно узнать о процессе гораздо больше. Системная биология пока ограничена способностью приборов считывать данные, а также возможностью эти данные объединять с помощью программ.

Два сотрудника нашей лаборатории прошли стажировку в США и участвовали там в исследованиях обмена веществ. В результате удалось открыть новый, ранее неизвестный науке цикл обмена веществ. Статья об этом исследовании уже подана в один из ведущих научных журналов. Думаю, системная биология – одно из важных направлений биоинформатики на ближайшие 10 лет. Она будет иметь широкое применение в медицине. На словах принцип прост: врач подключает к пациенту устройство, считывает параметры его организма, создаёт его математическую модель и, исходя из этого, подбирает лечение или синтезирует уже имеющийся препарат.

Беседовала Наталья Григорьева. Фото AFP