Новости про искусственный интеллект

Samsung продемонстрировала виртуальную ИИ-клавиатуру SelfieType

Печать на клавиатуре — один из основных типов взаимодействия человека и компьютера. Существует огромное множество эргономичных клавиатур, однако когда речь заходит о смартфонах, не всё так однозначно.

Компания Samsung решила разнообразить варианты портативного клавиатурного ввода, представив проект виртуальной клавиатуры SelfieType. Её концепция была разработана по исследовательской программе Samsung C-Lab Inside.

Система SelfieType полагается на фронтальную «селфи» камеру устройства и искусственный интеллект, который анализирует движения пальцев пользователя.

Прототип Samsung SelfieType
Прототип Samsung SelfieType

Чтобы ей воспользоваться, нужно наклонить фронтальную камеру смартфона, планшета или любого другого устройства и начать «печатать» на любой поверхности, как на традиционной клавиатуре. Камера отправляет изображение к ИИ, который и преобразует движения пальцев непосредственно в буквы на экране. Технология не требует какого-либо специального оборудования и может применяться на широком спектре устройств.

Пока этот проект находится в самом зачаточном состоянии. При его демонстрации были обнаружены несколько ошибок. Из недостатков можно отметить отсутствие видимых клавиш для печати, пользователь не знает, на какую букву он нажимает, что у многих вызовет недоумение. Также нет обратной реакции от клавиши, и не понятно, была буква введена, или нет.

В любом случае, до коммерческого релиза SelfieType ещё далеко.

Intel приобретает разработчика микросхем ИИ Habana Labs

Компания Intel объявила о приобретении Habana Labs, израильского разработчика программируемых ускорителей глубокого обучения для центров обработки данных за сумму, равную 2 миллиардам долларов.

Комбинация усилит портфель Intel в области ИИ и ускорит усилия на быстро развивающемся кремниевом рынке ИИ, который по мнению компании, к 2024 году должен вырасти до 25 миллиардов долларов.

Стратегия Intel в области ИИ основана на уверенности, что развитие мощи ИИ позволит увеличить поступления от бизнеса в широком спектре технологий и программного обеспечения, покрывая всю экосистему. В наши дни решения в области ИИ помогают клиентам превратить данные в бизнес, и стимулируют значительную прибыль для компаний.

В 2019 году Intel ожидает получить более 3,5 миллиардов долларов от систем искусственного интеллекта, на 20% больше, чем в прошлом. Работая вместе, Intel и Habana смогут ускорить обеспечение центров обработки данных лучшими в классе продуктами ИИ.

После закрытия сделки Habana останется независимым бизнес-подразделением и сохранит нынешнюю руководящую команду. Новая структура Habana будет отчитываться перед Intel Data Platforms Group, которая является домом для технологий искусственного интеллекта для центров обработки данных.

NVIDIA представила ИИ-хореографа

Компания NVIDIA активно работает в сфере искусственного интеллекта, представив систему, которая автоматически генерирует танцы на основании музыкальных видео. По словам разработчиков, они натренировали модель глубокого обучения с помощью 71 часа танцевальных видео.

Чтобы помочь в автоматическом создании танцевальных видео, исследователи NVIDIA в сотрудничестве с Университетом Калифорнии создали модель глубокого обучения, которая может автоматически объединять новые различные танцевальные движения, находящиеся в одном общем стиле и в соответствии с ритмом.

Генерация танцевальных движений
Генерация танцевальных движений

«Это сложная, но интересная генеративная задача, которая потенциально поможет и расширит возможности создания контента в искусстве и спорте, таком, как театральный перформанс, ритмическая гимнастика и фигурное катание», — заявили исследователи NVIDIA на конференции Систем обработки нейронной информации (NeurIPS 2019).

Исходный код работы будет опубликован NVIDIA на GitHub.

NVIDIA научилась превращать картинки в 3D-модели

Исследователи искусственного интеллекта из компании NVIDIA смогли создать механизм преобразования плоских изображений в трёхмерные модели.

В своём блоге компания пояснила, что это необходимо для улучшения понимаемости искусственным интеллектом обрабатываемых объектов. Это будет полезно для приложений, взаимодействующих с реальными объектами, например, с роботами. После тренировки, трехмерная модель на основе изображения создаётся за 100 мс.

Примеры моделирования птиц
Примеры моделирования птиц

В традиционной компьютерной графике трёхмерные модели отображаются на плоских экранах, идея NVIDIA заключается в обратном процессе. Благодаря преобразованию плоского объекта в трёхмерный автоматизированные системы могут улучшить слежение за ним.

Учёные NVIDIA хотят построить архитектуру, способную выполнять эту задачу преобразования без потерь времени с использованием техник машинного обучения. Процесс представляет собой высокоточный рендеринг, выполняемый с использованием архитектуры кодировки-декодировки, варианта нейронной сети, которые трансформирует вводные данные в карту особенностей или вектор, который, в последствии, применяется для предсказания специфичной информации, вроде формы, цвета, текстуры и карты освещённости.

Модель синицы
Модель канарейки

Примеры таких преобразований приведены на рисунках, и судя по ним, NVIDIA неплохо натренировала свой ИИ на птиц.

Cerebras выпускает 400 000-ядерный процессор

Похоже, что Cerebras наконец-то создала компьютер, который сможет запустить Crysis — Cerebras CS-1.

Система Cerebras CS-1 предназначена для искусственного интеллекта, а именно для его разработчиков. Компания Cerebras получила мировую известность за свой самый крупный в мире чип. В августе она анонсировала новый процессор, а теперь он готов к коммерческой эксплуатации. Новый чип умещается в компьютере высотой 66 см. Этот процессор содержит 400 000 ядер и поразительные 1,2 триллиона транзисторов.

Компьютер Cerebras с самым большим процессором в мире
Компьютер Cerebras с самым большим процессором в мире

Данный процессор получит название Wafer Scale Engine (WSE). Также он содержит 18 ГБ встроенной памяти SRAM, а его внутренняя шина развивает скорость 1 ПБ/с (да-да, петабайт). Представленный чип WSE — просто гигантский. Достаточно посмотреть на фотографию, где он лежит рядом с клавиатурой.

Процессор WSE от Cerebras
Процессор WSE от Cerebras

Основатель Cerebras Systems Эндрю Фельдман пояснил: «CS-1 является самым быстрым в индустрии компьютером для ИИ, и поскольку его легко установить, принести и интегрировать в существующую модель ИИ в TensorFlow и PyTorch, он даст результаты в первый день эксплуатации. В зависимости от нагрузки, CS-1 обеспечивает ускорение производительности в сотни или тысячи раз по сравнению с наследными альтернативами, занимая лишь одну десятую долю пространства».

VIA готовит новый x86-процессор с аппаратным ускорением ИИ

Компания VIA вспомнила, что она также обладает лицензией на процессоры x86, и решила создать новый чип, который предназначен для промышленного применения. Главной его особенностью станет аппаратная поддержка искусственного интеллекта.

Разрабатывается процессор дочерней фирмой CenTaur. Новый чип может стать ключевым элементом системы распознавания лиц в средствах видеонаблюдения. Пока же он находится на этапе рабочего прототипа.

Компьютер для анализа системы видеонаблюдения на базе нового процессора CenTaur
Компьютер для анализа системы видеонаблюдения на базе нового процессора CenTaur

Что касается архитектуры, то новый процессор CenTaur использует 64-битные ядра, а также встроенный сопроцессор ИИ, названный NCORE. Кольцевая шина объединяет восемь вычислительных ядер и NCORE с прочими компонентами процессора. Также CPU имеет 16 МБ распределённой памяти кэша L3, четырёхканальный контроллер DDR4-3200, 44 линии PCI-Express 3.0 и полностью интегрированный южный мост, что делает процессор настоящей SoC. Из особенностей заявлена поддержка нескольких сокетов, при этом VIA не сообщает шину связи между процессорами.

Архитектура нового процессора CenTaur
Архитектура нового процессора CenTaur

Для программного обеспечения ядро NCORE является PCI-устройством, которое позволяет выполнять машинное обучение. Очень похоже, что по факту NCORE является аппаратным решением для перемножения матриц, однако по словам разработчиков, оно позволяет выполнять задачи, связанные с ИИ, со скоростью «20 триллионов операций в секунду с пропускной способностью памяти 20 терабайт в секунду».

Тактовая частота процессора составляет 2,50 ГГц, но говорить о производительности пока не приходится, поскольку VIA не предоставила никаких данных. Впрочем, процессор поддерживает новейший набор инструкций AVX-512 (которого нет даже у Zen 2), так что сопроцессор должен быть высокого уровня.

NVIDIA выпускает Jetson Xavier NX

Компания NVIDIA выпустила новый ускоритель, который она назвала «самым маленьким и мощным суперкомпьютером ИИ для роботов и передовых встраиваемых вычислительных устройств».

Будучи меньше кредитной карты, энергоэффективный модуль Jetson Xavier NX обеспечивает производительность серверного уровня, до 21 триллиона операций в секунду при современной ИИ-нагрузке. При этом он потребляет лишь 10 ватт.

Модуль NVIDIA Jetson Xavier NX
Модуль NVIDIA Jetson Xavier NX

В качестве сферы применения, разработчики называют малые коммерческие роботы, дроны, средства оптического контроля, сетевые видеорекордеры, портативные медицинские устройства и прочие промышленные системы интернета вещей.

Характеристики Jetson Xavier NX таковы:

  • GPU: Volta с 384 ядрами CUDA cores и 48 ядрами Tensor, плюс 2x NVDLA.
  • CPU: 6-ядер Carmel ARM 64-бит, 6 МБ L2 + 4 МБ L3.
  • Видео: кодирование 2x4K30 и декодирование 2x4K60.
  • Камера: до шести камер CSI (36 через виртуальные каналы); 12 линий (3x4 или 6x2) MIPI CSI-2.
  • Память: 8 ГБ 128-бит LPDDR4X, 51,2 Гб/с.
  • Подключение: Gigabit Ethernet.
  • ОС: Ubuntu Linux.
  • Размер модуля: 70x45 мм.

Модуль Jetson Xavier NX будет доступен с марта 2020 года по цене 400 долларов.

12 нм технология GlobalFoundries обещает не уступать 10 нм процессам конкурентов

Компания GlobalFoundries объявила о доступности нового технологического процесса 12 Leading Performance (12LP), который был назван 12LP+. Этот процесс должен обеспечить заметный прирост производительности и снижение энергопотребления.

Разработчики сообщают, что прирост в производительности соответствует 7-нанометровой технологии, но при этом сохраняется преимущество низкой себестоимости платформы 12LP. Также на 15% увеличится плотность транзисторов.

Собственно говоря, 12LP+ FinFET от GF предлагает 20% прирост в производительности или 40% снижение в энергопотреблении по отношению к базовой платформе 12LP, которая сама предлагает 10% улучшение над 16/14 нм и 15% улучшение в масштабировании логики. Это тот же уровень, который заявляет TSMC для 7 нм по отношению к 16 нм.

Офис GlobalFoundries
Офис GlobalFoundries

Также компания отмечает, что процесс 12LP+ является зрелым в технологическом смысле, а потому имеет мало брака, а новая система «однократного инжиниринга» NRE (non-recurring engineering) позволяет снизить стоимость разработки вдвое.

Ещё одной интересной особенностью платформы стало размещение на чипах ячеек низковольтной SRAM напряжением 0,5 В, которые предлагается использовать в качестве кэша между памятью и процессором, что будет полезно для систем ИИ.

Сейчас GlobalFoundries утверждает, что она уже имеет заказы на производство чипов для облачных вычислений и ИИ от нескольких заказчиков. Первые опытные образцы этих микросхем должны быть выпущены во второй половине 2020 года, а массовое производство запланировано на 2021 год.

Sony получила патент на сервис PlayStation Assist

В наши дни смарт-дома становятся всё популярнее. Люди охотно используют цифровых ассистентов для разных целей. Сфера видеоигр не стала исключением. Консоль Xbox One, наряду с Cortana, поддерживает Google Assistant и Amazon Alexa. Теперь к этому фестивалю искусственного интеллекта решила примкнуть и Sony.

Как и другие цифровые помощники, в основе PlayStation Assist лежит искусственный интеллект. Однако в отличие от аналогов, этот ассистент будет иметь более глубокую интеграцию с играми, что позволит игрокам задавать вопросы вроде «где найти ближайшую аптечку» или «куда мне идти дальше», и получить ответ сразу на игровой карте.

Пример запроса к ассистенту PlayStation Assist
Пример запроса к ассистенту PlayStation Assist

В патенте Sony помощник PlayStation Assist описывается как «метод игровой поддержки», который позволяет игрокам «попросить помощь через запрос к бэкенд-серверу игровой помощи». При этом «запрос может быть любого формата или комбинацией форматов, включая аудио, текст, видео и т.д.»

Пример запроса к ассистенту PlayStation Assist
Пример запроса к ассистенту PlayStation Assist

Всё это значит, что вместо поиска информации на телефоне и последующего сопоставления карты на двух устройствах, на PlayStation будет достаточно нажать на специальную кнопку, сформулировать вопрос и тут же получить на него ответ, внутри самой игры. Причём вопрос может касаться как прохождения игры, так и дополнительных возможностей, вроде информации о персонаже или отзывов о самой игре.

Пример запроса к ассистенту PlayStation Assist
Пример запроса к ассистенту PlayStation Assist

Идея хороша. Но это лишь патент. А патенты не всегда получают коммерческую реализацию. Будем надеяться, что увидим описанное здесь решение в консоли PlayStation 5.

NVIDIA использует ядра Tensor вместо зелёного экрана

Компания NVIDIA представила движок RTX Broadcast Engine, который задействует тензорные ядра в графических процессорах серии GeForce RTX для фильтрации фонового изображения и создания эффекта «зелёного экрана».

Эта технология предлагает живую фильтрацию, виртуальный зелёный экран и прочие технологии, которые пригодятся игровым стримерам в Twitch. Суть технологии заключается в полном удалении фона за спиной комментатора игрового стрима. Этот фон можно заменить непосредственно игровым процессом, или любым другим изображением.

RTX Broadcast Engine
RTX Broadcast Engine

«Модель ИИ RTX Greenscreen понимает, какой частью изображения является человек, а какой — фон, так что геймеры смогут получить преимущества зелёного экрана, не приобретая таковой».

Также инструментарий RTX Broadcast Engine предлагает некоторый функционал дополненной реальности. Он использует вебкамеру для определения лица, а затем отслеживает мимику. Таким образом можно наложить речь и эмоции на 3D-персонажа, так же, как это умеют делать флагманские смартфоны.