«Исторический прорыв Microsoft» был совершен с помощью российских разработчиков

31 окт 2016 20:40 #47617 от ICT
Российский рекорд на английском языке Как стало известно CNews, группа исследователей Microsoft в области искусственного интеллекта по автоматическому распознаванию телефонных разговоров удалось добиться рекордного результата с помощью методики, разработанной резидентом «Сколково», компанией «ЦРТ-инновации», входящей в группу ЦРТ, «Центр речевых технологий». На днях компания Microsoft объявила , что ее система распознавания речи по уровню точности сравнялась с распознаванием речи живым человеком, при этом ошибка распознавания речи составила 5,9% — то есть, более 94% слов система распознаёт верно. Такой же результат в аналогичных условиях показали профессиональные стенографисты. «Мы достигли уровня человека. Это историческое достижение», — заявил главный инженер исследовательской группы Microsoft по работе с искусственным интеллектом Сюэдунь Хуань (Xuedong Huang). Согласно данным научной публикации исследователей из Microsoft, наибольший вклад в улучшение результата внесло использование метода, предложенного Группой ЦРТ на международной конференции Interspeech сентябре 2016 г. в Сан-Франциско. На вопрос CNews о том, почему эксперимент производился с английским языком, Александр Затворницкий, руководитель отдела распознавания речи ЦРТ, ответил, что в русском языке в простых задачах вроде распознавания команд или дикторской речи порядок ошибки составляет 5-7%, в телефонных диалогах 15-25%. Ситуация бывает и хуже и лучше в зависимости от темпа беседы, темы, интеллигентности беседующих. http://filearchive.cnews.ru/img/cnews/2016/10/31/101.jpg">[/url] Александр Затворницкий, руководитель отдела распознавания речи ЦРТ По словам Александра, английский является наиболее изученным и довольно простым, поскольку относится к языкам, в котором грамматические отношения, в основном, передают не словоизменением, а служебными словами. В итоге, словарь на 50 тыс. словоформ для английского - это довольно много, а для русского нужно не менее 200 тыс. По его словам, сложны флективные или аглютинативные языки (русский, арабский и другие), а также малоизученные языки. Но человеческая речь постоянно преподносит сюрпризы: например, распознавание малоизученного аглютинативного грузинского на практике оказалась не очень сложной задачей. [b]Где деньги?[/b] По словам Александра, владение даже основами технологии распознавания дает преимущества даже на нынешнем этапе: «распознавание речи используется все чаще на мобильных устройствах, потому что из-за небольшого экрана набирать текст с помощью клавиатуры не всегда удобно. Этому способствует как развитие облачных технологий, так и увеличение мощности самих гаджетов. Технология применяется как в голосовых помощниках, так и просто для быстрого набора текста. Голосовые помощники становятся все более «умными» благодаря развитию технологий, и пользователи начинают активнее ими пользоваться. В корпоративном сегменте распознавание речи активнее всего используется в голосовых IVR и в бизнес-анализе». На российском рынке, по словам Александра, «ЦРТ-инновации» преуспели в обоих сегментах, для завоевания мирового рынка нужно развивать распознавание других языков (помимо русского): «Мы сделали распознавание английского как наиболее распространенного и намерены делать локализацию наших продуктов для него, но также наша стратегия в этом отношении – занять нишу редких языков. Мы первые сделали распознавание казахского, готовое к промышленному внедрению, и распознавание египетского диалекта арабского». В настоящее время разработки «ЦРТ-инноваций» активно внедряются в отечественной индустрии. Например, один из продуктов компании, Smart Logger II, позволяет использовать распознавание речи в бизнес-анализе. Его активно используют аналитики контакт-центров (например, в Ростелекоме) для решения таких задач, как выявление лучших и худших практик в продажах, анализ причин длительных и повторных обращений, анализ причин возникновения претензий, оценка продвижения сервисов самообслуживания, анализ соблюдения операторами скриптов и стандартов обслуживания клиентов, а также выявление причин оттока клиентов. Принцип работы алгоритма основан на первичном распознавании речи всех 100% фонограмм диалогов клиентов с операторами. Затем они анализируются по параметрам, заданным аналитиком: от поиска ключевых слов, сигнализирующих что-то конкретное, до разделения всех диалогов на тематические кластеры (используется для выявления, например, непрофильных тем обращений) и анализа эмоционального фона. [url=http://forum.cnews.ru/]CNews Forum 2016: Информационные технологии завтра[/url] [url=http://www.cnews.ru/news/top/2016-10-31_rossijskie_razrabotchiki_ustanovili_rechevoj_rekord] Ссылка на источник[/url][img]http://filearchive.cnews.ru/img/cnews/2016/10/31/101.jpg"> Александр Затворницкий, руководитель отдела распознавания речи ЦРТ По словам Александра, английский является наиболее изученным и довольно простым, поскольку относится к языкам, в котором грамматические отношения, в основном, передают не словоизменением, а служебными словами. В итоге, словарь на 50 тыс. словоформ для английского - это довольно много, а для русского нужно не менее 200 тыс. По его словам, сложны флективные или аглютинативные языки (русский, арабский и другие), а также малоизученные языки. Но человеческая речь постоянно преподносит сюрпризы: например, распознавание малоизученного аглютинативного грузинского на практике оказалась не очень сложной задачей. Где деньги? По словам Александра, владение даже основами технологии распознавания дает преимущества даже на нынешнем этапе: «распознавание речи используется все чаще на мобильных устройствах, потому что из-за небольшого экрана набирать текст с помощью клавиатуры не всегда удобно. Этому способствует как развитие облачных технологий, так и увеличение мощности самих гаджетов. Технология применяется как в голосовых помощниках, так и просто для быстрого набора текста. Голосовые помощники становятся все более «умными» благодаря развитию технологий, и пользователи начинают активнее ими пользоваться. В корпоративном сегменте распознавание речи активнее всего используется в голосовых IVR и в бизнес-анализе». На российском рынке, по словам Александра, «ЦРТ-инновации» преуспели в обоих сегментах, для завоевания мирового рынка нужно развивать распознавание других языков (помимо русского): «Мы сделали распознавание английского как наиболее распространенного и намерены делать локализацию наших продуктов для него, но также наша стратегия в этом отношении – занять нишу редких языков. Мы первые сделали распознавание казахского, готовое к промышленному внедрению, и распознавание египетского диалекта арабского». В настоящее время разработки «ЦРТ-инноваций» активно внедряются в отечественной индустрии. Например, один из продуктов компании, Smart Logger II, позволяет использовать распознавание речи в бизнес-анализе. Его активно используют аналитики контакт-центров (например, в Ростелекоме) для решения таких задач, как выявление лучших и худших практик в продажах, анализ причин длительных и повторных обращений, анализ причин возникновения претензий, оценка продвижения сервисов самообслуживания, анализ соблюдения операторами скриптов и стандартов обслуживания клиентов, а также выявление причин оттока клиентов. Принцип работы алгоритма основан на первичном распознавании речи всех 100% фонограмм диалогов клиентов с операторами. Затем они анализируются по параметрам, заданным аналитиком: от поиска ключевых слов, сигнализирующих что-то конкретное, до разделения всех диалогов на тематические кластеры (используется для выявления, например, непрофильных тем обращений) и анализа эмоционального фона. CNews Forum 2016: Информационные технологии завтра Ссылка на источник


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    В России совершен прорыв в создании 50-кубитного квантового компьютера16.57Пятница, 18 января 2019
    Интерес российских разработчиков ПО к продуктам Microsoft продолжает снижаться14.26Среда, 17 августа 2022
    Для шлема дополненной реальности Microsoft Hololens вышло первое приложение российских разработчиков13.82Пятница, 19 августа 2016
    Совершен первый международный звонок в российских сетях 5G13.54Среда, 05 июня 2019
    Совершен первый международный видеозвонок в российских сетях 5G13.54Четверг, 06 июня 2019
    Депутаты передумали облагать НДС российских разработчиков ПО10.49Четверг, 09 июня 2016
    Выручка российских разработчиков ПО взлетела до 1,7 трлн руб.10.49Пятница, 23 июня 2023
    «Яндекс» поглотил разработчиков знаменитых российских антивирусов10.38Вторник, 08 декабря 2015
    США ввели санкции против российских разработчиков микроэлектроники10.38Пятница, 31 августа 2018
    Apple наказала российских разработчиков из-за «налога на Google»10.38Среда, 14 ноября 2018

    Мы в соц. сетях