Когнитивные API (ИИ сервисы) для бизнеса


03.05.19. Microsoft представила сервисы для распознавания рукописного текста и заполненных форм


Microsoft представила несколько новых когнитивных сервисов на своей облачной платформе Azure Machine Learning. Во-первых, это подарки для компаний, имеющих дело с документами, формами и служебными записками с рукописным текстом. Сервисы Ink Recognizer и Form Recognizer позволяют переводить все эти бумажки в цифровой текст и данные. Сервис Conversation Transcription - переводит в текст диалоги по телефону с распознаванием автора каждой фразы. К сожалению, это все пока только на английском. Еще один новый сервис Personalizer позволяет подбирать персонализированные рекомендации для посетителей сайта или интернет-магазина на основании поведенческих факторов. Кроме того, Microsoft представила новый визуальный конструктор для создания моделей машинного обучения. Теперь даже маркетологи смогут поиграться. Нужно всего лишь загрузить базу данных и указать, какой параметр требуется спрогнозировать.


2017. Microsoft запустила еще три когнитивных API сервиса


Microsoft добавила в свою облачную платформу Azure еще 3 программных интерфейса когнитивных сервисов: Face API, Computer Vision API и Content Moderator. Face API может использоваться для обнаружения и сравнения человеческих лиц, объединения их в группы по визуальной схожести и идентификации ранее отмеченных людей на изображениях. Computer Vision API предоставляет разработчикам средства для понимания того, что изображено на любой картинке. Он создаёт метки, идентифицирующие объекты или происходящее на снимках, и составляет связные предложения для описания этого. Content Moderator позволяет выполнять карантинную проверку изображений, текста и видео перед публикацией. Модерация видео осуществляется как часть Azure Media Services.


2017. Ozlo превратился в API для разговорных интерфейсов


Помните нового виртуального ассистента Ozlo? Он передумал быть виртуальным ассистентом. Вместо этого, он решил помочь разработчикам быстро создавать разговорные интерфейсы к своим приложениям (за денюжку, конечно). Ozlo предлагает свою модель мира, которая состоит из 2 млрд фактов и к ней 3 API интерфейса: Data API - для пополнения/изменения модели мира (графа знаний), Intent API - для понимания вопросов пользователей (преобразования слов в смысл), и Converse API - для формулирования ответа (преобразования смысла в слова). Пример работы Ozlo виден на картинке. Исходя из вопроса "Можно ли завалить толпой в реторан Gravity и пожрать там устриц", он определил, что в данном ресторане подают устриц и приветствуют групповые посиделки и сформулировал ответ.


2016. Google предоставил свои технологии машинного обучения в качестве облачных API


В облачной платформе Google Cloud Platform появился сервис Learning Cloud Machine, который предоставляет возможность сторонним разработчикам создавать приложения, использующие ИИ-технологии компании. На данный момент сервис предоставляет 4 API-интерфейса: Cloud Speech API (распознавание речи), Vision API (компьютерное зрение), Translate API (переводчик), Cloud Natural Language API (обработка естественного языка). Например, стороннее приложение может отправить в Cloud Speech API запись голоса и получить обратно текстовую транскрипцию. Качество распознавания будет таким же, как например в Google Now. При этом разработчику нет необходимости самому разбираться в машинном обучении для распознавания речи. Напомним, в марте подобный ИИ API запустила и Microsoft.


2016. Microsoft запустила ИИ-сервисы для разработчиков


Microsoft открыла доступ к сервисам Microsoft Cognitive Services, которые представляют собой API-интерфейсы к технологиям машинного обучения. С помощью этих API-интерфейсов разработчики могут очень просто встроить в свои гаджеты и приложения такие функции как распознавание речи, компьютерное зрение, распознавание лиц, проверку правописания, обработку естественного языка и т.д. Разумеется, за каждую транзакцию нужно будет заплатить денежку, например $1.5 за тысячу распознанных лиц. Напомним, IBM запустила подобную платформу для разработчиков на базе Watson еще в 2014 году.