Движки и фреймворки для машинного обучения


28.08.19. Huawei хочет стать как Apple для Искусственного интеллекта


Компания Huawei представила свой процессор для систем машинного обучения - Ascend 910, который они называют самым быстрым ИИ-процессором в мире (на данный момент). Его вычислительная мощность - 256 терафлопс (триллионов операций в секунду). Для сравнения - у нового ИИ-чипа Intel - 180 терафлопс. Но это еще не все. Huawei разработала фреймворк для создания ИИ-приложений - MindSpore, который будет конкурировать с гугловским Tensorflow. Фишка в том, что он идеально использует ресурсы вышеупомянутого процессора. Т.е. за счет синергии харда и софта, Huawei хочет добиться в сфере ИИ того, чего добился Apple в производстве мобильных девайсов.


2017. Яндекс выложил в свободный доступ свой движок машинного обучения CatBoost


Яндекс выложил исходный код алгоритма машинного обучения CatBoost, которым компания планирует заменить Матрикснет в Поиске и всех остальных своих проектах. CatBoost, как и Матрикснет, реализует модель градиентного бустинга. Особенность алгоритмов машинного обучения такого типа заключается в том, что они эффективнее, чем другие модели, работают с разнородными данными, которые описывают различные факторы: например, информацию о демографии, предпочтениях пользователя и историю запросов. Основным преимуществом CatBoost перед «Матрикснетом» создатели называют его способность работать не только с числовыми, но и с другими данными. Библиотека доступна на языках программирования R и Python, она поддерживает операционные системы Linux, Windows и macOS.


2017. Microsoft добавил гугловскую систему машинного обучения TensorFlow в облако Azure Machine Learning


Microsoft представила набор инструментов Azure Batch AI Training для обучения глубоких нейросетей, который скоро станет частью платформы Azure Machine Learning. Он позволяет использовать наиболее популярные фреймворки для глубокого обучения TensorFlow от Google, Cognitive Toolkit от Microsoft, Caffe и «любые другие библиотеки». Система предназначена для обучения глубоких нейросетевых моделей — например, реккурентных и свёрточных нейронных сетей и глубоких сетей доверия. Одна из основных особенностей таких моделей заключается в том, что для их работы требуются большие объёмы памяти для хранения и обработки информации обо всех внутренних зависимостях.


2016. Microsoft открыла для разработчиков свой фреймфорк для машинного обучения - Cognitive Toolkit


Microsoft последовала примеру Гугла и выложила в свободном доступе свой движок для нейросетей Cognitive Toolkit. Именно он использовался для создания, например, Skype Translator и Cortana. Разработчики получили возможность работать с этим фреймворком в интегрированной среде Visual Studio. Также в него была добавлена поддержка языка Python. Cognitive Toolkit - платформа широкого назначения, и она способна работать на основе разных данных, включая речь, текст и изображения. А процесс обучения может проходить на множестве стандартных CPU и GPU.  Она конкурирует с гуловской платформой TensorFlow, а также рядом других открытых фреймворков: Torch, Caffe, Paddle и др. В Майкрософт утверждают, что их платформа позволяет добиться самой высокой производительности на рынке.


2016. Intel купила разработчика библиотеки компьютерного зрения OpenCV


Open-source библиотека алгоритмов компьютерного зрения OpenCV известна, пожалуй, всем кто интересуется технологиями машинного обучения. Однако, далеко не все знают, что большинство ведущих разработчиков OpenCV живут и трудятся в России, в городе Нижний Новгород, и являются сотрудниками компании Itseez. С 2000 по 2008 год OpenCV разрабатывалась и поддерживалась в основном Intel. Однако, затем Intel практически прекратила поддержку проекта, и он выживал благодаря спонсорству компаний Willow Garage и NVidia. Теперь же в Intel опять сильно заинтересовались машинным обучением и компьютерным зрением и решили выкупить старый знакомый стартап.


2015. Google открыл код своей системы машинного обучения TensorFlow


Google преобразовал свою систему машинного обучения TensorFlow в проект с открытым исходным кодом. TensorFlow позволяет создавать и обучать нейросети и используется компанией в сервисах распознавания устной речи, написания автоматических ответов в электронной почте и для распознавания картинок в Google Photos. Представители Google отмечают, что решения, разработанные при помощи TensorFlow, легко масштабируются в зависимости от имеющихся аппаратных ресурсов, поэтому платформа может принести пользу как научно-исследовательским организациям, так и энтузиастам машинного обучения. ***