"Яндекс" запустил функцию распознавания текста на картинках

25 март 2015 15:00 #12031 от ICT
Moscow-Live.ru Компания "Яндекс" объявила о запуске сервиса, который позволит пользователям "Яндекс.Диска" распознавать текст на загруженных изображениях. Об этом сообщается в блоге "Яндекса" . С помощью этой функции можно будет легко находить нужные изображения форматов JPEG, GIF и PNG, содержащие текст поискового запроса. "Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст, будь то объявление на двери подъезда или любопытный рекламный плакат в метро", - говорится в публикации. Сообщается, что в основе поиска текстов на изображениях лежит технология оптического распознавания символов, способная распознавать текст на разных по виду, содержанию и качеству картинках. Система включает в себя классификатор картинок и модуль распознавания. Сначала классификатор анализирует все изображения, отбирая те, на которых обнаруживается текст. Когда изображения с текстом отобраны, алгоритм находит на них линии, предположительно содержащие текст, а затем отбираются только те линии текста, в которых алгоритм уверен. На следующем этапе модуль распознавания разбивает линии текста на отдельные символы. Для каждого символа выбирается несколько наиболее вероятных вариантов распознавания. После этого в дело вступает языковая модель - алгоритм принимает решение, какой из символов-кандидатов подходит лучше всего. Языковая модель опирается на словари и учитывает не только сходство символов с теми, что знает система, но и контекст. Если из нескольких вероятных символов складывается известное системе слово, то она принимает решение, что на картинке написано именно оно, даже в том случае, если некоторые символы-кандидаты в этом слове менее вероятны. В сообщении отмечается, что точность распознавания текста зависит от типа изображения, его четкости, фона, на котором находится текст, и многих других факторов. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями - 63,2%, а для скриншотов приближается к 100%. Помимо русского языка система также распознает английский, украинский и турецкий. Точность распознавания текстов всего потока изображений составляет свыше 70%, и в компании обещают улучшить этот показатель. Ссылка на источник


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    «Биорг» и Docsvision создадут систему распознавания рукописного текста со сканов для СЭД14.07Понедельник, 05 декабря 2016
    Abbyy представила новую iOS-версию приложения TextGrabber для распознавания и перевода текста13.93Четверг, 22 июня 2017
    «Атом безопасность» встроила систему распознавания текста в новую версию Staffcop Enterprise13.78Среда, 28 ноября 2018
    «Яндекс» запустил сервис распознавания изображений Vision13.76Вторник, 23 апреля 2019
    Facebook продвигает функцию распознавания лиц12.65Среда, 04 сентября 2019
    Росбанк представил новую функцию распознавания документов для корпоративных клиентов12.12Пятница, 26 апреля 2024
    «Яндекс» анонсировал новую функцию поиска10.85Понедельник, 12 июля 2021
    Twitter запустил функцию Periscope Producer10.66Пятница, 14 октября 2016
    Telegram запустил функцию голосовых звонков10.66Четверг, 30 марта 2017
    В «Яндекс 360» добавили функцию создания и редактирования файлов со смартфона10.62Вторник, 21 сентября 2021

    Мы в соц. сетях