Компьютерное зрение для бизнеса


26.04.19. Walmart открыл умный супермаркет


Walmart запустил в Нью-Йорке первый супермаркет с элементами искусственного интеллекта. В нем над стелажами с продуктами установлены сотни видеокамер, с помощью которых ИИ система отслеживает наличие товара на полках, а также следит, чтобы представленные продукты не были просрочены. Если товар на полке закончился или его срок годности истек - система отправляет сообщение ответственному сотруднику. Для обработки видеоинформации прямо в магазине оборудован дата-центр, который потребляет довольно много электичества. Насколько выгодно использование такой системы - в Walmart пока не рассказывают.


2018. Mail.Ru запустила сервис компьютерного зрения для бизнеса


Платформа Mail.Ru для Бизнеса пополнилась сервисом компьютерного зрения Vision. В основе Vision лежит нейросеть, которая обеспечивает хорошее качество и высокую скорость распознавания предметов, людей, сооружений и сцен на фото и видео (в офлайне или в реальном времени). Например, Mail.ru предлагает использовать сервис для автоматизации обработки контента, пропускного контроля (распознавания лиц сотрудников), систем безопасности (выявления задымлений...), распознавания постоянных покупателей и нежелательных гостей в магазинах, контроля отгружаемой продукции, выявления сбоев, брака и дефектов в процессе производства. На сайте проекта можно загрузить любое фото и увидеть, какие объекты нейросеть на нем распознала. Другие игроки на этом рынке - FindFace и Видеоинтеллект.


2017. Google представил API для поиска объектов в видео


Google запустил Cloud Video Intelligence API для поиска объектов по видео на базе технологии глубокого машинного обучения. С его помощью разработчики смогут находить объекты по заданным критериям внутри видеоконтента с точностью их появления до секунд. Инструмент предназначен для крупных технологических и медиакомпаний, а также, по видимому, будет использоваться на Youtube. Поиск осуществляется по ключевым словам. Можно задавать как имя существительные, так и глаголы: например собака, цветок, бежит, плывет, летит. Например, поиск по слову тигр найдет все кадры, на которых появляется тигр.


2016. Система распознавания лиц Vocord установила новый мировой рекорд


Российская компания Vocord, которая создает системы безопасности с использованием компьютерного зрения, установила новый мировой рекорд в распознавании лиц - показала точность 80%. Система Vocord FaceControl уже несколько лет используется для поиска преступников в публичных местах и контроля доступа на предприятия. Она позволяет в реальном времени узнавать в толпе человека из базы розыска (или черного списка) и оповещать правоохранительные органы. Летом этого года стало известно, что система была переведена на использование нейросетей.


2016. Зачем Intel скупает разработчиков компьютерного зрения


В этом году компания Intel купила уже два стартапа, разрабатывающих технологии компьютерного зрения: российский Itseez (который разработал автомобильную систему распознавания знаков) и американский Movidius (тот самый, который создал микропроцессор для компьютерного зрения). Зачем это производителю компьютерных платформ? Дело в том, что основную прибыль Intel приносят персональные компьютеры и ноутбуки, и компания придумала кое-какую новую фичу, способную поднять их продажи. Это - Intel RealSense - камера (а точнее 3 камеры), распознающая движения пользователя (что-то вроде Microsoft Kinect). Эта штука позволит взаимодействовать с компьютером на новом уровне. Это вам не клавиатура с мышкой, и даже не тачскин.


2016. Intel купила разработчика библиотеки компьютерного зрения OpenCV


Open-source библиотека алгоритмов компьютерного зрения OpenCV известна, пожалуй, всем кто интересуется технологиями машинного обучения. Однако, далеко не все знают, что большинство ведущих разработчиков OpenCV живут и трудятся в России, в городе Нижний Новгород, и являются сотрудниками компании Itseez. С 2000 по 2008 год OpenCV разрабатывалась и поддерживалась в основном Intel. Однако, затем Intel практически прекратила поддержку проекта, и он выживал благодаря спонсорству компаний Willow Garage и NVidia. Теперь же в Intel опять сильно заинтересовались машинным обучением и компьютерным зрением и решили выкупить старый знакомый стартап.


2015. Нейросеть Microsoft победила Google и Intel в конкурсе на распознавание изображений


Программа, разработанная командой Microsoft Research под руководством Цзянь Сана (на фото) показала лучший результат на шестом конкурсе по распознаванию изображений ImageNet. Ей удалось превзойти конкурентные системы от Google, Intel, Qualcomm и Tencent, а также ряда стартапов. Система компьютерного зрения Microsoft представляет собой очень глубокую нейросеть из 150 слоев, которую обучали с применением фреймворка глубокого остаточного обучения. Microsoft уже использует компьютерное зрение в своих продуктах: игровом сенсоре Kinect и системе распознавания лиц Windows Hello.


2015. Российский стартап смог обойти Google в конкурсе по распознаванию лиц


Российская компания N-tech.lab вошла в первую пятерку во всех номинациях конкурса алгоритмов по распознаванию лиц Megaface, а в двух из них стала победителем, обойдя Google. В частности, N-tech победил при распознавании около 900 тысяч изображений людей разных возрастов. В основе системы распознавания лиц N-tech лежит уникальная технология компактного хранения признаков лица и алгоритм поиска. «Мы считаем это победой, ведь наш алгоритм показал лучший результат в основной категории. Особенно приятно, что мы обучали наш алгоритм на трех компьютерах, в то время как Google понадобилось 1000 серверов», – говорит основатель N-tech.lab Артем Кухаренко. Компания N-tech.lab основана только в этом году.


2015. Искусственный интеллект Baidu побил рекорд Google в распознавании изображений


Китайскаий интернет-гигант Baidu создал суперкомпьютер Minwa, который (по словам разработчиков) сумел превзойти рекорд компании Google по качеству распознавания изображений. Суперкомпьютер показал точность 95,42%, по сравнению с результатом 95,2%, показанным искусственным интеллектом Гугла. Minwa имеет 72 мощных центральных процессоров и 144 графических процессоров. В компьютере запрограммирована нейронная сеть, способная не только выполнить распознавание объектов на изображениях с высокой разрешающей способностью, но и самообучаться, что позволяет системе выявлять характерные особенности каждого из отдельных объектов. Таким образом, система может распознать изображение, представленное в любой форме, даже когда оно повернуто на некоторый угол и сфотографировано снова.


2015. Microsoft предлагает использовать ППВМ вместо GPU для компьютерного зрения


Традиционно системы компьютерного зрения строят на графических процессорах (GPU). Они лучше подходят для этой задачи, чем центральные процессоры, потому что позволяют параллельно выполнять много потоков обработки информации. Но в Microsoft говорят, что GPU потребляют слишком много энергии. Поэтому, они предлагают использовать ППВМ-чипы (Программируемые пользователем вентильные матрицы). ППВМ программируются путём изменения логики работы принципиальной схемы, например с помощью исходного кода на языке проектирования. ППВМ потребляют в 10 раз меньше энергии. Например, один ППВМ процессор потребляет 25 Вт, а GPU - 235 Вт. При этом, ППВМ за 1 секунду может распознавать 233 изображения против 500 у GPU.


2014. Компьютерная нейронная сеть распознает изображения быстрее мозга


Группа исследователей из Массачусетского технологического института доказала, что по крайней мере в одном аспекте нейросети для компьютерного зрения уже могут победить биологический мозг - в скорости. Они провели эксперимент с обезьянами. Показывали им быстро сменяющиеся картинки, снимая при этом карту активности их мозга. Оказалось что если картинка показывается всего 100 милисекунд, обезьяна успевает ее увидеть, но не успевает осознать (распознать изображенные объекты). А вот нейросеть, созданная этими же ребятами - отлично справлялась с этой задачей за указанное время. Правда, на выходе нейросети были не образы, а всего лишь последовательности чисел (каждое число соответствует определенному распознанному объекту, наприме дерево=4).


2013. Стартап Vicarious победил каптчу при помощи компьютерного зрения


Американский стартап Vicarious объявил, что его система компьютерного зрения может с 90% точностью определять надписи на любых каптчах (в т.ч. на Google reCAPTCHA), которые используются для защиты от спама в интернете. Причем, по словам разработчиков, в отличии от обычных систем компьютерного зрения, которые используют брутфорс (большие компьютерные мощности, обученные на большом объеме данных), их система гораздо ближе по энергоэффективности к человеческому мозгу. Вообще Vicarious считается одним из передовых ИИ стартапов в США. Он уже получил десятки млн долларов инвестиций от таких ребят, как Марк Цукерберг, Элон Макс, Джефф Безос, Марк Беньофф и т.д.