Создан алгоритм, автоматически меняющий местоимения в документах полиции

01 дек 2020 15:40 #98264 от ICT
Сотрудники Центра искусственного интеллекта российского ИТ-вуза победили в хакатоне "Цифровой прорыв", разработав решение для кейса Департамента информационных технологий, связи и защиты информации МВД РФ. За 1 место в соревновании они получили 750 тысяч рублей. От участников хакатона требовалось разработать алгоритм, который проводит лингвистический анализ документов, после чего преобразует повествование от первого лица в текст от третьего лица: например, из сочетания "Я увидел, что Иванов подошёл ко мне" в "Он увидел, что Иванов подошёл к нему". Команда Университета Иннополис обучила нейронную сеть (архитектура БЕРТ) на датасете новостных сводок объёмом 12 Гб, она размечает принадлежность сказуемого к нужному подлежащему, определяет форму слова и морфологические категории. Результаты нейросети использовались для написания Python-алгоритма на основе эвристик и правил русского языка. Решение учитывает специфику ведомственных текстов, а также способно обрабатывать художественные тексты. Алгоритм обрабатывает местоимения, глаголы, предлоги, цитаты, прямую речь, определяет принадлежность местоимений к именам и выделяет героев, даты, суммы денег, локации. Сотрудники российского ИТ-вуза предложили внедрить алгоритм в комплексный сервис с веб-интерфейсом, куда пользователь может вставить текст, загрузить текстовые файлы разных форматов, аудио-файлы для распознавания речи и изображения с текстом. Также разработан плагин для LibreOffice с выделением измененных частей текста. "Разработанное решение протестировали эксперты из МВД РФ. Алгоритм показал отличные результаты на их примерах. Мы за 48 часов разработали кросс-платформенный автономный продукт, который готов к внедрению в ведомство и способен избавить сотрудников органов внутренних дел от рутинных задач", — рассказал лидер команды, сотрудник Центра искусственного интеллекта Университета Иннополис Семён Киселёв. Ссылка на источник


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    Для российской полиции создан дрон-парализатор с электрошокером14.16Среда, 15 мая 2019
    Создан алгоритм для автоматизированной борьбы с интернет-троллями13.09Вторник, 21 апреля 2015
    В США создан компьютерный алгоритм для кодирования человеческих воспоминаний13.09Среда, 30 сентября 2015
    Создан алгоритм по склеиванию тысяч чужих фото из интернета в таймлапсы12.81Понедельник, 18 мая 2015
    Ученые создали материал, меняющий цвет в зависимости от силы удара10.01Вторник, 18 августа 2015
    Во внутренних документах Microsoft объясняется, что такое "Windows as a Service"9.27Понедельник, 29 июня 2015
    РСПП нашел в документах Минсвязи угрозу ограничения доступа в Рунет9.17Среда, 26 июня 2019
    Apple сообщила, что закрыла большинство уязвимостей iOS, упомянутых в опубликованных WikiLeaks документах ЦРУ9.08Среда, 08 марта 2017
    Google вслед за Apple заявила об устранении уязвимостей, перечисленных в обнародованных документах ЦРУ9.08Четверг, 09 марта 2017
    В Йоханнесбурге Uber просит защиты у полиции8.21Вторник, 07 июля 2015

    Мы в соц. сетях