Служба Google Translate "поумнела" благодаря искусственному интеллекту

За счёт технологии глубокого обучения уже оптимизирован ряд продуктов компании √ Google Maps, Google Photos и Gmail. Теперь на очереди веб-сервис Google Translate.

За счёт технологии глубокого обучения уже оптимизирован ряд продуктов компании √ Google Maps, Google Photos и Gmail. Теперь на очереди веб-сервис Google Translate.
Фото Thomas Samson/AFP.

Служба онлайн-перевода Google Translate готовится к использованию нового алгоритма, полностью основанного на технологии глубокого обучения. Теперь количество ошибок в переводах сократится на 60% и система будет адаптировать тексты под каждого пользователя, учитывая поведенческие привычки в Сети.

Служба онлайн-перевода Google Translate готовится использовать новый алгоритм, который полностью основан на технологии глубокого обучения (разновидность машинного обучения).

Собственно, уже сейчас гугловский переводчик использует системы искусственного интеллекта (например, при переводе текста, захваченного камерой смартфона). Однако пока такая методика используется лишь частично, а качество итоговых текстов до сих пор оставляло желать лучшего. Как отмечается в пресс-релизе компании, новый алгоритм уменьшит количество ошибок службы перевода минимум на 60% (от 60 до 87%).

Основное отличие заключается в том, что теперь сервис будет опираться больше на нейронные сети, а не статистический перевод и алгоритмы краудсорсинга, которые использовались до недавнего времени.

Сама технология глубокого обучения, которая станет основой новой системы Neural Machine Translation, была детально описана ещё в 2014 году. Разработчики уверяют, что NMTS значительно опережает классические методы машинного перевода и способна выдавать удивительные результаты.

К примеру, если раньше перевод происходил "от слова к слову", то теперь алгоритм будет анализировать миллионы доступных вариантов и использовать словосочетания или комбинации, подходящие по смыслу или даже сочетающиеся на ассоциативном уровне. При этом система будет следить за целостностью и связностью текста. Разработчики сравнили этот принцип с распознаванием лиц, когда сложное единое изображение постепенно составляется из отдельных пикселей.

Кроме того, по словам главы команды Google Brain Джеффа Дина (Jeff Dean), переводчик сможет анализировать поведенческие привычки каждого пользователя и выдавать "индивидуализированный" перевод для каждого гугл-аккаунта.

Тестирование обновлённого Google Translate прошло на английско-китайской версии для мобильных и веб-приложений. Другие языки будут доступны уже в течение нескольких месяцев, говорят разработчики.

Также для оценки производительности системы перевода исследователи Google использовали статьи из "Википедии", и они в итоге не уступали по качеству тем, которые переводили профессиональные лингвисты.

Китайский язык был выбран неслучайно: такой перевод сложнее, чем работа с двумя языками из общей индоевропейской группы. Хотя тест ограничивался предложениями с простыми конструкциями, разработчики остались довольны: по их словам, для некоторых других пар языков из одной и той же ветви или группы перевод окажется максимально приближенным к нормальному человеческому.

Подробное описание новинки опубликовано на сайте препринтов.

Напомним, что ранее искусственный интеллект Google уже продемонстрировал свои способности к обучению, обыграв чемпиона мира по игре го.