Казанские ученые научили машину читать по губам

Ученые из Казани создали распознаватель речи, который не только слышит человека, но и читает по губам. Это позволяет машине намного лучше понимать, что ей говорят. Устройство уже может работать на семи языках.

Ученые из Казани создали распознаватель речи, который не только слышит человека, но и читает по губам. Это позволяет машине намного лучше понимать, что ей говорят. Устройство уже может работать на семи языках.

Машина и человек понимают друг друга с полуслова: она не только слышит, но и считывает. Компьютер анализирует движение губ, сопоставляет их с голосом и набирает текст. Технология распознавания речи RealSpeak создавалась на базе уже имеющихся аудиопрограмм. Микрофон, веб-камера и устойчивый Интернет – это все, что нужно для разговора с техникой.

"Системы распознавания речи развиваются уже давно, — рассказывает руководитель RealSpeaker Виктор Осетров. — Нет смысла изобретать велосипед и создавать распознаватель речи с нуля. Мы используем уже готовое решение – наша задача улучшить то, что есть в видео. Видео – это тоже источник информации, который позволяет более качественно распознавать речь".

Передать машине искусство чтения по губам исследователи пытаются давно. Все начиналось с концептов с датчиками на лице – сегодня это выглядит комично. С казанской разработкой можно поговорить на семи языках.

Разработчики уверены: первыми, кому пригодятся такие возможности, будут те, у кого они ограничены. Уже сейчас в Интернете можно скачать бесплатную версию и попробовать свои силы в печати голосом. Следующий этап применения такой системы – дистанционное управление приборами с одного только слова.