Новый алгоритм будет самостоятельно исследовать рак по научным статьям

Данные о самых современных исследованиях рака будут сформированы в большие базы, после чего механизм будет выявлять причинно-следственные связи

(иллюстрация Wikimedia Commons).

DARPA Big Mechanism будет собирать данные, "читая" научные статьи о раке

(иллюстрация DARPA).

Летом 2014 года Агентство по перспективным оборонным научно-исследовательским разработкам США DARPA инвестировало $45 миллионов в новую биомедицинскую программу под названием Big Mechanism (или "Большой механизм").

Данный проект направлен на развитие компьютерных систем, которые смогут самостоятельно "читать" научные публикации на тему онкологических заболеваний, связанных с мутациями в гене семьи Ras. Затем машины будут интегрировать информацию в компьютерную модель и самостоятельно формировать новые научные гипотезы, которые люди смогут в дальнейшем проверять на практике.

В конце января 2015 года 12 команд-участниц программы встретились в Вашингтоне, округ Колумбия, чтобы подвести итоги своей работы. Прогресс в данной сфере достиг определённых высот, и разработчики Механизма — алгоритма, способного теоретически подвести итоги исследований в области онкологии — утверждают, что Big Mechanism будет полезен не только в изучении рака, но и в климатологии, военном деле и различных социальных изысканиях.

"Располагать большими данными о сложных экономических, биологических, нейронных и климатических системах — не то же самое, что осознавать причинно-следственную связь в этих системах. Научные статьи, которые исследует Big Mechanism, содержат большое количество фрагментарных, а порой и противоречивых данных о предмете исследования. Ни один человек не сможет вывести здесь какую-либо закономерность. Вот почему мы обращаемся за помощью к компьютерам", — говорит менеджер программы Пол Коэн (Paul Cohen) из DARPA.

DARPA Big Mechanism будет собирать данные, "читая" научные статьи о раке
(иллюстрация DARPA).

Любой алгоритм, схожий по принципу работы с DARPA Big Mechanism, призван собирать информацию в большие базы данных — так называемые Big Data — и, самое главное, устанавливать причинно-следственные связи между одними и другими тезисами, заявленными в этих данных. Цель работы новой программы заключается в исследовании этих самых причинно-следственных связей в изучении биологии рака с акцентом на сигнальные пути.

Для работы DARPA Big Mechanism потребуется масса новых исследований и интеграция знаний из многих областей, таких как статистика, обработка естественного языка, математическая и системная биология, логика и так далее. По мнению авторов проекта, исследование рака станет лишь первой ступенью огромной лестницы принципиально нового подхода к интеграции научных знаний и использованию причинно-следственных связей для ускорения прогресса в самых разных областях.

Команда разработчиков в данный момент работает над "обучением" алгоритма. Информатики отрабатывают механизмы дедуктивных выводов, качественного моделирования и даже симуляции работы сигнальных путей. Также DARPA Big Mechanism будет дополнен вероятностными и количественными моделями для получения более приближенных к реальности результатов.

Те выводы, что DARPA Big Mechanism представит в ближайший год, учёные планируют начать проверять экспериментально. На гипотезы, которые выдвинет компьютер, возлагаются большие надежды, и исследователи должны будут провести серии опытов в самое ближайшее время. Окончание экспериментального этапа программы запланировано на 2017 год.