Такие компьютеры уже находятся в разработке, однако подобная мультиязычная читающая по губам модель была спроектирована впервые. Данное открытие весьма пригодится глухим, сотрудникам правоохранительных органов и тем, кто зачастую пребывает в условиях шума.
Инновационное исследование было представлено 22 апреля на конференции в Тайване. Его авторы — Стивен Кокс и Джейк Ньюман из школы компьютерных наук университета Восточной Англии.
Технология была создана на основе статистического моделирования движений губ, которые выполнили 23 диктора, говорящих на двух и трех языках. Новая система может с высокой точностью распознавать, на каком языке вещает говорящий. Распознаваемые языки включают английский, французский, немецкий, арабский, мандарин ( «путунхуа»), кантонский, итальянский, польский и русский.
«Это прогресс в области автоматических технологий распознавания языка, а также исследование служит научным подтверждением наших догадок относительно того, что люди, говорящие на разных языках, по-разному располагают губы во время произношения», сказал профессор Кокс. «Например, французы чаще округляют губы во время разговора, а арабы совершают больше движений языком».
В дальнейшем ученые намерены усовершенствовать систему с тем, чтобы она могла более точно распознавать слова, вне зависимости от физиологии и языковой манеры человека.