- Hi-Tech, Статьи дня, Технологии

Правда ли, что молчание – золото?

Буквально на днях ученые Оксфордского университета заявили, что им удалось создать алгоритм, который помогает читать по губам с удивительной точностью. Эта способность является довольно нужным навыком, особенно важным для людей с инвалидностью слуха и агентов спецслужб. Чтение по губам всегда может пригодиться и обычным людям, ведь можно удовлетворить свой интерес, наблюдая за беседой людей издалека.

Сегодня довольно много программ, которые могут читать по губам, однако, большинство из них показывают крайне низкую эффективность и стабильность. А, как утверждают ученые из Оксфорда, программа с их алгоритмом способна читать по губам с удивительно точность, чуть более 93%. На сегодняшний день это лучший результат.

Приложение имеет большой практический потенциал. Так, например, данный алгоритм можно было бы использовать для сверхточных слуховых аппаратов, с его помощью стало бы возможным проводить беззвучные лекции, изобретать приборы для скрытой передачи информации. Вполне возможно, что изобретение можно было бы встроить в современные ПК и общаться с компьютером на одном языке.

Правда, кроме большой пользы он мог бы нанести и немалый вред, особенно это касается личной свободы и тайны личной жизни. Ведь с его помощью можно получать информацию, которую человек хотел бы оставить в тайне или о которой должен знать лишь узкий круг лиц. В наш информационный век качественная и свежая, интересная широкому кругу людей информация на вес золота. Конечно, устройство, читающее по губам, можно использовать при слежках и хорошо, если это будут частные детективы или правоохранительные органы, но ведь это могут быть и преступники. Стоит вам проболтаться в общественном месте о том, что вы собираетесь уехать на отдых, и квартира будет пустовать месяц, как профессиональные домушники начнут подготовку к ограблению. Как только данное устройство попадет в массовую продажу, залогом безопасности будет молчание, причем молчать придется везде, даже дома!

Ученые всех стран мира уже не первый год бьются над проблемой распознавания речи по губам, но до последнего времени результаты были посредственными. Перед исследователями стоит важнейшая задача — создать программу, которая понимала бы речь человека на основе его мимики. Как утверждают ученые из Оксфордского университета, им это удалось, и алгоритм рекуррентной нейросети LipNet с этой задачей справился. Основа их разработки практически ничем не отличается от аналогичных алгоритмов, но им удалось решить важнейшие проблемы. LipNet в отличие от большинства аналогов может не только распознавать некоторое слова, но и целые предложения. Нейросеть не пытается анализировать слова отдельно друг от друга, она считывает все предложение целиком и уже после этого начинает расшифровывать полученные данные.

На сегодняшний день нейросеть LipNet однозначно является передовой разработкой, которая дает возможность в ближайшем будущем не только помочь людям со слабым слухом, но и интегрировать данную разработку в высокотехнологичные продукты нового поколения.

Это разработка, возможно, станет предвестником создания новейших кибер-роботов, машин, способных не просто реагировать на мимику человека, а интерпретировать ее и действовать. Такой высокий уровень распознавания речи поможет создать роботов сурдопереводчиков, дать возможность людям общаться с компьютерами напрямую. Совершенный алгоритм распознавания человеческой речи приблизит переход от информационного века к веку робототехническому.

Добавить комментарий