Исследователи из Оксфорда научили нейросеть читать по губам лучше человека

09 нояб 2016 12:20 #48020 от ICT
Группа исследователей из Оксфордского университета создала первую в мире программу, способную распознавать речь по губам на уровне целых предложений лучше, чем это делают подготовленные люди. Как пишет N+1 , работа программы основана на использовании нейросетей и методов глубинного обучения. При этом ее создателям удалось решить проблему, с которой сталкивались их предшественники: новый алгоритм способен считывать не только слова и словосочетания, но и целые предложения. Добиться такого результата ученым удалось при помощи программы LipNet, в основе которой лежит LSTM-нейросеть. Эта нейросеть представляет собой подвид рекуррентных нейросетей, для которых характерно наличие обратной связи. Ее главная особенность заключается в том, что она способна обучаться долговременным зависимостям. Помимо этого, исследователи использовали специальную сверточную нейросеть (STCNN), которая хорошо справляется с задачей анализа видео, и обучение методом нейросетевой темпоральной классификации (Connectionist Temporal Classification, CTC). Для обучения программы ученые использовали материала базу данных Grid, в которой было собрано более 32 тысяч видеозаписей. На них 13 человек произносили на английском языке предложения, построенные по одинаковому принципу, но содержащие разные варианты слов для каждой словесной категории. Всего каждое предложение имело по 64 тысячи вариантов. После того как программа научилась понимать говорящего при помощи 88% выборки Grid, качество ее работы было проверено на оставшихся 12% видеозаписей. В результате исследователи установили, что алоритм может правильно распознавать речь по губам с точностью в 93,4%. По этому показателю LipNet обошла как другие подобные программы, так и специально обученных людей, для которых показатель распознавания составляет 52,3%. Однако ученые подчеркивают, что программа была проверена в тепличных условиях, и в случае работы с произвольной человеческой речью точность распознавания по губам может быть значительно хуже. Ссылка на источник


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    Британские ученые научили компьютер читать по губам24.7Вторник, 29 марта 2016
    Исследователи научили нейросеть оценивать уровень бедности по спутниковым снимкам20.15Пятница, 19 августа 2016
    Исследователи научили робота лучше захватывать предметы при помощи манипулятора-соперника20.05Среда, 07 июня 2017
    Слепых научили "читать" обычные книги при помощи специальной камеры14.17Пятница, 11 ноября 2016
    Исследователи научили робота охотиться за добычей13.91Четверг, 07 июля 2016
    Исследователи научили дрон распознавать насилие в толпе13.76Четверг, 07 июня 2018
    Нейросеть научили давать советы о любви13.68Пятница, 27 января 2017
    Нейросеть научили взламывать пароли миллионами13.68Вторник, 19 сентября 2017
    Нейросеть научили распознавать отретушированные снимки13.68Понедельник, 25 июня 2018
    Исследователи научились распознавать эмоции человека при помощи Wi-Fi роутера13.67Четверг, 22 сентября 2016

    Мы в соц. сетях