"Яндекс" запустил функцию распознавания текста на картинках
25 март 2015 15:00 #12031
от ICT
ICT создал тему: "Яндекс" запустил функцию распознавания текста на картинках
Moscow-Live.ru
Компания "Яндекс" объявила о запуске сервиса, который позволит пользователям "Яндекс.Диска" распознавать текст на загруженных изображениях. Об этом сообщается в
блоге "Яндекса"
. С помощью этой функции можно будет легко находить нужные изображения форматов JPEG, GIF и PNG, содержащие текст поискового запроса. "Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст, будь то объявление на двери подъезда или любопытный рекламный плакат в метро", - говорится в публикации. Сообщается, что в основе поиска текстов на изображениях лежит технология оптического распознавания символов, способная распознавать текст на разных по виду, содержанию и качеству картинках. Система включает в себя классификатор картинок и модуль распознавания. Сначала классификатор анализирует все изображения, отбирая те, на которых обнаруживается текст. Когда изображения с текстом отобраны, алгоритм находит на них линии, предположительно содержащие текст, а затем отбираются только те линии текста, в которых алгоритм уверен. На следующем этапе модуль распознавания разбивает линии текста на отдельные символы. Для каждого символа выбирается несколько наиболее вероятных вариантов распознавания. После этого в дело вступает языковая модель - алгоритм принимает решение, какой из символов-кандидатов подходит лучше всего. Языковая модель опирается на словари и учитывает не только сходство символов с теми, что знает система, но и контекст. Если из нескольких вероятных символов складывается известное системе слово, то она принимает решение, что на картинке написано именно оно, даже в том случае, если некоторые символы-кандидаты в этом слове менее вероятны. В сообщении отмечается, что точность распознавания текста зависит от типа изображения, его четкости, фона, на котором находится текст, и многих других факторов. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями - 63,2%, а для скриншотов приближается к 100%. Помимо русского языка система также распознает английский, украинский и турецкий. Точность распознавания текстов всего потока изображений составляет свыше 70%, и в компании обещают улучшить этот показатель.
Ссылка на источник
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
Похожие статьи
Тема | Релевантность | Дата |
---|---|---|
«Биорг» и Docsvision создадут систему распознавания рукописного текста со сканов для СЭД | 14.09 | Понедельник, 05 декабря 2016 |
Abbyy представила новую iOS-версию приложения TextGrabber для распознавания и перевода текста | 13.95 | Четверг, 22 июня 2017 |
«Атом безопасность» встроила систему распознавания текста в новую версию Staffcop Enterprise | 13.8 | Среда, 28 ноября 2018 |
«Яндекс» запустил сервис распознавания изображений Vision | 13.79 | Вторник, 23 апреля 2019 |
Facebook продвигает функцию распознавания лиц | 12.67 | Среда, 04 сентября 2019 |
Росбанк представил новую функцию распознавания документов для корпоративных клиентов | 12.14 | Пятница, 26 апреля 2024 |
«Яндекс» анонсировал новую функцию поиска | 10.87 | Понедельник, 12 июля 2021 |
Twitter запустил функцию Periscope Producer | 10.68 | Пятница, 14 октября 2016 |
Telegram запустил функцию голосовых звонков | 10.68 | Четверг, 30 марта 2017 |
В «Яндекс 360» добавили функцию создания и редактирования файлов со смартфона | 10.64 | Вторник, 21 сентября 2021 |