Создана первая автоматическая система хранения файлов в ДНК

Система полностью автоматизирует считывание и запись данных в ДНК.

Иллюстрация Microsoft.

Исследователи из корпорации "Майкрософт" и Вашингтонского университета создали первую автоматическую систему хранения данных в ДНК. Она записывает нужные файлы в структуру биологической молекулы и считывает их без участия человека. Это важный шаг к компьютерам, которые используют ДНК вместо современных запоминающих устройств.

Достижение описано в научной статье, опубликованной в журнале Scientific Reports.

Зачем нужен столь экзотический способ хранения данных? Разве современных запоминающих устройств недостаточно? Как ни странно, нет. В развитых странах, где сегодня для каждого младенца создаётся больше портретов, чем было у любого средневекового короля, количество данных растёт лавинообразно. Современный дата-центр представляет собой огромное помещение, забитое оборудованием. Хранение данных в ДНК поможет уместить все файлы среднего дата-центра внутри устройства размером со спичечный коробок.

Второе преимущество такой технологии – долговечность. Современные жёсткие диски и флэш-носители выходят из строя за десятилетия. Между тем ДНК в некоторых костях мамонтов или древних людей сохранялась в течение многих тысячелетий, хотя условия для её существования были не самые благоприятные.

Именно поэтому исследователи смотрят на ДНК как на носитель информации будущего. На данный момент исследователи Microsoft научились сохранять таким образом один гигабайт данных, превысив свой предыдущий рекорд в 200 мегабайт. Однако человечеству предстоит ещё долгий путь к блокам памяти, основанным на этой технологии.

До недавнего времени одна из проблем заключалась в том, что технология записи и считывания данных не была полностью автоматизирована. Хотя основные этапы работы выполняли роботы, на некоторых этапах требовался ручной труд.

"Мы не можем себе позволить, чтобы вокруг центра обработки данных с пипетками бегала группа людей. Это повышает вероятность ошибок из-за человеческого фактора, это будет слишком дорого стоить и так далее", – констатирует ведущий автор нового исследования Кристофер Такахаси (Christopher Takahashi).

Поэтому авторы разработали полностью автоматизированную систему.

Устройство принимает данные в обычном цифровом виде. Компьютер переводит их с языка двоичного кода (комбинаций нулей и единиц), на котором они хранятся в памяти компьютера, на язык четырёхбуквенного "алфавита" А, Т, Ц и Г (напомним, что так обозначаются четыре вида нуклеотидов, из которых, как из кирпичиков, состоит ДНК). Далее химическая часть системы синтезирует нужные нуклеотиды и собирает из них нить ДНК. При чтении данных всё происходит в обратном порядке.

Авторы продемонстрировали работу своего детища, записав на ДНК и считав с неё слово hello ("привет").

"Наша конечная цель – запустить в эксплуатацию систему, которая для конечного пользователя будет очень похожа на любой другой сервис облачного хранения: биты отправляются в центр обработки данных и сохраняются там, а затем они просто появляются, когда становятся нужны клиенту", – говорит соавтор исследования Карин Штраус (Karin Strauss) из "Майкрософт".

Впрочем, помимо автоматизации, исследователям нужно решить и другие проблемы, чтобы сделать технологию конкурентоспособной.

Во-первых, синтез и секвенирование (по сути, чтение) ДНК – всё ещё достаточно дорогое удовольствие. При этом количество нуклеотидов в нити ДНК, которые можно прочесть за тысячу долларов США, удваивается примерно каждые два года. Если эта тенденция сохранится, то полное секвенирование, скажем, генома человека (примерно три миллиарда нуклеотидов в нити ДНК) начнёт обходиться в такую сумму не ранее 2040 года. А ведь объём информации, который в нём закодирован, совсем невелик: порядка одного гигабайта. Легко сравнить эти цифры со стоимостью и объёмом современных жёстких дисков.

Во-вторых, работу такого запоминающего устройства нужно сделать такой же быстрой, как и у его электронных аналогов. Для этого, в частности, нужно наладить эффективный поиск нужных данных в подобном хранилище.

Наконец, хотя сами нити ДНК, как уже упоминалось выше, исключительно компактны, современная версия устройства для записи и чтения в них информации довольно громоздка. Систему следует сделать более миниатюрной.

Несмотря на все эти вызовы, исследователи сохраняют оптимизм. Неизвестно, как скоро их работа позволит создать генетические блоки памяти, но любые технологии, позволяющие работать с ДНК быстрее, проще и дешевле, чем сегодня, уж точно пригодятся биологам и медикам.

Напомним, что ранее "Вести.Наука" (nauka.vesti.ru) писали о ДНК-транзисторах и кодировании изображений с помощью ДНК, а также о том, какие опасности могут быть связаны с таким способом хранения информации.