Автоматический ввод и распознавание заполненных форм для бизнеса

Обновлено: 11.10.2021

Машинное обучение позволяет создать нейросети, которые умеют автоматически извлекать данные из заполненных (отсканированных) форм. Как правило, эти формы должны иметь квадратики для букв. Таким образом, распознавание форм сводится к распознаванию рукописных букв. Примеры использования распознавания форм для бизнеса - даны ниже.

2021. ValueAI - российская ИИ система сортировки входящих обращений



Компания WaveAccess, российский разработчик ПО, представила ValueAI — инструмент на базе машинного обучения, позволяющий автоматизировать обработку входящих обращений от клиентов или пользователей: электронных писем, сообщений в мессенджеры, заявок на поставку или оказание услуг, тикетов в техподдержку или запросов подробной информации. Система фактически заменяет первую линию клиентского сервиса, а выводы из данных с ее помощью можно извлекать, не написав ни строчки кода. Кроме того, она может использоваться отделами продаж и маркетинга для поиска релевантных заявок и увеличения конверсии. ИИ обучается на собственных входящих запросах компании (заявках с текстовыми и/или числовыми данными).


2021. Directum выпустил облачный AI-сервис по 100%-ному распознаванию документов Inbox



Новый AI-сервис по 100%-ному распознаванию, который входит в состав интеллектуальной системы Directum Ario One, берет обработку входящего документопотока на себя. Сотруднику достаточно отсканировать документы и загрузить их для дальнейшей обработки. На этом его участие в оцифровке завершается. Интеллектуальные механизмы Directum Ario распознают текст, классифицируют документы по типам и извлекают из содержимого факты. На основании обработанной информации формируется и отправляется задание на проверку верификаторам. Квалифицированные облачные операторы проверяют результаты машинной обработки и при необходимости дозаполняют нераспознанные реквизиты. В целях безопасности они не видят всего объема данных, так как информация передается им частями.


2021. Directum запустил сервис интеллектуального извлечения данных из документов



Компания Directum еще 2 года назад выпустила систему для извлечения данных из документов Ario - которая с помощью машинного обучения парсит данные из различных сканов (договоров, заявок, обращений...) и заносит их в ECM систему Directum. Теперь компания представила сервис Directum Ario One, который может заносить извлеченные данные через Web API в любую информационную систему, используемую в вашей компании. Directum Ario One позволяет исключить участие человека даже на этапе верификации данных. При настройке можно задать значения, по которым корректность классификации и точность извлечения будут определяться автоматически. На их основании система верифицирует данные сама, а ответственный получит уведомление об успешной обработке.


2020. На Google Cloud появился ИИ-сервис для извлечения данных из документов и форм


Google запустил на своей облачной платформе новый когнитивный API-сервис Document AI, который позволяет автоматически извлекать информацию, содержащуюся в цифровых и печатных документах, с помощью машинного обучения. Предполагается использование двух процессоров общего назначения, первый - для обычных документов, второй - для анкет/форм. Есть также специализированные процессоры для финансовой документации, например, можно обрабатывать заявки на выдачу ссуд или счета-фактуры. Главными конкурентами Google в этом сегменте являются компания Amazon, которая предлагает подобный сервис Textract на AWS, а также Microsoft со своим инструментом Form Recogniser.


2019. Amazon выпустила ИИ-альтернативу Abbyy FineReader


Ровно 10 лет назад компания ABBYY запустила онлайн сервис распознавания текста FineReader Online. Теперь подобный сервис есть и у Amazon - Amazon Textract. Однако, прогресс не стоит на месте, и амазоновский сервис уже умеет не только распознавать текст, но и понимать структуру документа (с помощью ИИ). Например, он учитывает и корректно обрабатывает колонтитулы, колонки, таблицы, заполненные формы и даже определяет некоторые форматы данных (имя, номер паспорта, номер социального страхования). Конечно, компанию ABBYY этим не удивить. Они сами собаку съели на технологиях искусственного интеллекта. Их движок уже умеет даже извлекать смысл из документов.


2019. Microsoft представила сервисы для распознавания рукописного текста и заполненных форм



Microsoft представила несколько новых когнитивных сервисов на своей облачной платформе Azure Machine Learning. Во-первых, это подарки для компаний, имеющих дело с документами, формами и служебными записками с рукописным текстом. Сервисы Ink Recognizer и Form Recognizer позволяют переводить все эти бумажки в цифровой текст и данные. Сервис Conversation Transcription - переводит в текст диалоги по телефону с распознаванием автора каждой фразы. К сожалению, это все пока только на английском. Еще один новый сервис Personalizer позволяет подбирать персонализированные рекомендации для посетителей сайта или интернет-магазина на основании поведенческих факторов. Кроме того, Microsoft представила новый визуальный конструктор для создания моделей машинного обучения. Теперь даже маркетологи смогут поиграться. Нужно всего лишь загрузить базу данных и указать, какой параметр требуется спрогнозировать.


2016. Анкета24 - сервис по распознаванию рукописных анкет


К сожалению программ, которые бы достаточно точно распознавали рукописный текст - пока нет. Для этого нужен искусственный интеллект. Поэтому, анкеты, заполненные вручную (например, клиентами в торговой точке, партнерами на выставке, кандидатами на работу в отделе кадров) - приходится вводить самостоятельно. Но сервис Анкета24 может решить эту проблему. Он использует живых операторов (которые справляются с задачей распознавания рукописного текста не хуже искусственного интеллекта). Причем, сервис конвертирует отсканированную или сфотканную анкету в электронный вид почти в реальном времени (от 60 секунд). Стоимость - от 2 до 12 рублей за анкету. Создатели сервиса говорят, что один и тот же текст набирают много операторов дважды (для скорости и точности), при этом каждый оператор видит только отдельные слова, а не всю анкету в целом - таким образом, конфиденциальные данные не будут раскрыты.