Когнитивные API (ИИ сервисы) для бизнеса

Обновлено: 02.11.2021

Когнитивные API позволяют разработчикам приложений легко встроить в них интеллектуальные функции, такие как распознавание изображений, лиц, речи, перевода текста, обработки естественного языка и т.д. Примеры когнитивных API даны ниже.

2021. Microsoft внедрит в облако Azure нейросеть GPT-3 и даст компаниям доступ к языковым моделям



Microsoft анонсировала OpenAI Service на основе своей облачной платформы Azure. Сервис можно использовать для разных задач — от обработки клиентских запросов и обобщения больших текстов до написания кода или генерации ответов на вопросы. В качестве примера Microsoft привела спортивную франшизу, которая разрабатывает приложение для взаимодействия с фанатами во время матчей. С помощью GPT-3 поток комментариев можно превратить в короткие подборки самых ярких моментов игры или сгенерировать оригинальный контент для соцсетей. Microsoft пообещала предоставить клиентам инструменты для фильтрации и модерации запросов и ответов пользователей. В мае компания интегрировала алгоритм GPT-3 в платформу low-code разработки Power Apps для упрощённого написания программного кода.


2019. Microsoft представила сервисы для распознавания рукописного текста и заполненных форм



Microsoft представила несколько новых когнитивных сервисов на своей облачной платформе Azure Machine Learning. Во-первых, это подарки для компаний, имеющих дело с документами, формами и служебными записками с рукописным текстом. Сервисы Ink Recognizer и Form Recognizer позволяют переводить все эти бумажки в цифровой текст и данные. Сервис Conversation Transcription - переводит в текст диалоги по телефону с распознаванием автора каждой фразы. К сожалению, это все пока только на английском. Еще один новый сервис Personalizer позволяет подбирать персонализированные рекомендации для посетителей сайта или интернет-магазина на основании поведенческих факторов. Кроме того, Microsoft представила новый визуальный конструктор для создания моделей машинного обучения. Теперь даже маркетологи смогут поиграться. Нужно всего лишь загрузить базу данных и указать, какой параметр требуется спрогнозировать.


2017. Microsoft запустила еще три когнитивных API сервиса



Microsoft добавила в свою облачную платформу Azure еще 3 программных интерфейса когнитивных сервисов: Face API, Computer Vision API и Content Moderator. Face API может использоваться для обнаружения и сравнения человеческих лиц, объединения их в группы по визуальной схожести и идентификации ранее отмеченных людей на изображениях. Computer Vision API предоставляет разработчикам средства для понимания того, что изображено на любой картинке. Он создаёт метки, идентифицирующие объекты или происходящее на снимках, и составляет связные предложения для описания этого. Content Moderator позволяет выполнять карантинную проверку изображений, текста и видео перед публикацией. Модерация видео осуществляется как часть Azure Media Services.


2017. Ozlo превратился в API для разговорных интерфейсов



Помните нового виртуального ассистента Ozlo? Он передумал быть виртуальным ассистентом. Вместо этого, он решил помочь разработчикам быстро создавать разговорные интерфейсы к своим приложениям (за денюжку, конечно). Ozlo предлагает свою модель мира, которая состоит из 2 млрд фактов и к ней 3 API интерфейса: Data API - для пополнения/изменения модели мира (графа знаний), Intent API - для понимания вопросов пользователей (преобразования слов в смысл), и Converse API - для формулирования ответа (преобразования смысла в слова). Пример работы Ozlo виден на картинке. Исходя из вопроса "Можно ли завалить толпой в реторан Gravity и пожрать там устриц", он определил, что в данном ресторане подают устриц и приветствуют групповые посиделки и сформулировал ответ.


2016. На AWS появились когнитивные API сервисы



Amazon запустила три когнитивных API-сервиса на своей платформе Amazon Web Services. Первый - Rekognition - позволяет распознавать изображения. Т.е. Вы подгружаете на платформу картинки, и получаете список названий объектов, например, название породы собаки. Второй - Amazon Polly - преобразует любой текст (на 24 языках, включая русский) в речь. Можно выбрать любой из 47 мужских и женских голосов. Третий - Lex - это движок, на котором работает виртуальная ассистентка Amazon Alexa. Он позволяет создавать чатботов внутри мессенджеров и мобильных приложений, отвечающих на вопросы ваших клиентов. Со старта есть интеграции с Facebook Messenger, Slack и Twilio.


2016. Google предоставил свои технологии машинного обучения в качестве облачных API


В облачной платформе Google Cloud Platform появился сервис Learning Cloud Machine, который предоставляет возможность сторонним разработчикам создавать приложения, использующие ИИ-технологии компании. На данный момент сервис предоставляет 4 API-интерфейса: Cloud Speech API (распознавание речи), Vision API (компьютерное зрение), Translate API (переводчик), Cloud Natural Language API (обработка естественного языка). Например, стороннее приложение может отправить в Cloud Speech API запись голоса и получить обратно текстовую транскрипцию. Качество распознавания будет таким же, как например в Google Now. При этом разработчику нет необходимости самому разбираться в машинном обучении для распознавания речи. Напомним, в марте подобный ИИ API запустила и Microsoft.


2016. Microsoft запустила ИИ-сервисы для разработчиков


Microsoft открыла доступ к сервисам Microsoft Cognitive Services, которые представляют собой API-интерфейсы к технологиям машинного обучения. С помощью этих API-интерфейсов разработчики могут очень просто встроить в свои гаджеты и приложения такие функции как распознавание речи, компьютерное зрение, распознавание лиц, проверку правописания, обработку естественного языка и т.д. Разумеется, за каждую транзакцию нужно будет заплатить денежку, например $1.5 за тысячу распознанных лиц. Напомним, IBM запустила подобную платформу для разработчиков на базе Watson еще в 2014 году.


2014. IBM открыла возможности Watson для сторонних приложений


IBM запустила платформу Watson Developer Cloud, которая предоставляет разработчикам приложений использовать когнитивные возможности этого искусственного интеллекта. Реализовано это через API-интерфейсы на облачной платформе IBM BlueMix. В частности, доступны такие функции, как определение языка, машинный перевод, анализ текста, визуализация данных, а также - главная функция Watson - ответы на вопросы, заданные естественным языком (это то, для чего Watson изначально был создан). Т.е. можно попросить Watson изучить текстовые материалы по определенной теме, задавать ему вопросы и получать короткие ответы (требующие знаний, а не логического мышления). Правда, пока Watson по прежнему может отвечать на вопросы только на английском.