Распознавания документов и извлечения данных

Искусственный интеллект для распознавания и извлечения данных из документов

См. также: Топ 10: ИИ платформы

30.10.19. В СЭД Кодекс:Документооборот появился модуль искусственного интеллекта


АО «Центр компьютерных разработок» представил модуль искусственного интеллекта для СЭД
Кодекс: Документооборот. Он служит для автоматической классификации обращений согласно Справочнику ОТК. Данное решение базируется на технологиях машинного обучения и нейросетях, анализирует текст документа, ранее поданные аналогичные обращения, территорию с которой прислано обращение, какие вопросы содержит письмо и т.д. На основании такого анализа строится предположение, что письмо принадлежит определённой тематической категории, должно быть рассмотрено специалистом, ответственным за данное направление или переправлено в соответствующее ведомство.


2019. ABBYY запустила сервис распознавания документов в мобильном браузере


Компания ABBYY создала сервис для распознавания изображений документов в мобильном браузере Mobile Web Capture. Он пригодится компаниям, которые используют онлайн формы для получения заявок и заказов от клиентов. Сервис позволяет сэкономить им время - вместо заполнения многочисленных полей, клиент может быстро сосканировать права или паспорт, и сервис распознает данные и заполнит поля самостоятельно. Причем, он легко интегрируется с онлайн формой и работает в мобильном браузере, т.е. пользователю не нужно устанавливать дополнительное приложение.


2019. Amazon выпустила ИИ-альтернативу Abbyy FineReader


Ровно 10 лет назад компания ABBYY запустила онлайн сервис распознавания текста FineReader Online. Теперь подобный сервис есть и у Amazon - Amazon Textract. Однако, прогресс не стоит на месте, и амазоновский сервис уже умеет не только распознавать текст, но и понимать структуру документа (с помощью ИИ). Например, он учитывает и корректно обрабатывает колонтитулы, колонки, таблицы, заполненные формы и даже определяет некоторые форматы данных (имя, номер паспорта, номер социального страхования). Конечно, компанию ABBYY этим не удивить. Они сами собаку съели на технологиях искусственного интеллекта. Их движок уже умеет даже извлекать смысл из документов.


2019. Microsoft представила сервисы для распознавания рукописного текста и заполненных форм


Microsoft представила несколько новых когнитивных сервисов на своей облачной платформе Azure Machine Learning. Во-первых, это подарки для компаний, имеющих дело с документами, формами и служебными записками с рукописным текстом. Сервисы Ink Recognizer и Form Recognizer позволяют переводить все эти бумажки в цифровой текст и данные. Сервис Conversation Transcription - переводит в текст диалоги по телефону с распознаванием автора каждой фразы. К сожалению, это все пока только на английском. Еще один новый сервис Personalizer позволяет подбирать персонализированные рекомендации для посетителей сайта или интернет-магазина на основании поведенческих факторов. Кроме того, Microsoft представила новый визуальный конструктор для создания моделей машинного обучения. Теперь даже маркетологи смогут поиграться. Нужно всего лишь загрузить базу данных и указать, какой параметр требуется спрогнозировать.


2018. Abbyy Finereader научился распознавать смысл документов при помощи ИИ


Компания Abbyy сделала шаг от распознавания буковок и слов к распознаванию смысла сканируемых документов. Зачем это нужно? Чтобы автоматизировать процессы ввода бумажных документов в информационные системы (авто-классификации документов, распознавания полей и таблиц, переноса данных из этих полей в структурированную базу данных). Новый движок ABBYY FineReader Engine 12 умеет это делать с помощью технологий обработки естественного языка и машинного обучения. Конечно, для реализации интеллектуального ввода документов не достаточно просто купить программу FineReader - нужно заказать у Abbyy индивидуальный проект.