Новости про искусственный интеллект

NVIDIA создала ИИ-программиста

Исследовательское подразделение компании NVIDIA объявила об очередном достижении. Её искусственный интеллект GameGAN смог воссоздать полный функционал игры Pac-Mac без доступа к игровому движку.

Модель обучалась путём просмотра 50 000 игровых видео. После чего искусственный интеллект создал свою версию игры. Игра Pac-Man, созданная GameGAN, выглядит и ощущается как и оригинальная, только разрешение у неё заметно ниже.

«Это первое исследование в попытке имитировать игровой движок внутри нейронной сети на базе GAN», — заявил Сюн-Вук Ким, исследователь NVIDIA и главный автор проекта. «Мы хотели увидеть, сможет ли ИИ понять правила и окружение лишь смотря на игровой экран прохождения. И он сделал это».

Pac-Man

По мере того, как искусственный агент играет в игру, генерированную GAN, GameGAN реагирует на действия, генерируя новые кадры игрового окружения в реальном времени. Более того, GameGAN может даже создавать уровни, которых никогда не существовало, если его обучить на скриншотах из различных уровней игры.

По словам авторов, этот функционал может быть использован для генерации новых уровней, а также для помощи в создании новых игр и тренировки автономных машин.

NVIDIA GameGAN: Celebrating 40 Years of PAC-MAN with Game-Changing AI

NVIDIA выпускает плагин шумоподавления RTX Voice

Владельцам видеокарт Turing доступны ядра Tensor Core и RTX, но сколько есть игр, поддерживающих RTX или DLSS/DLSS 2.0? По сути, эта технология пока мало востребована, и компания NVIDIA предложила её новое применение.

Технология NVIDIA RTX Voice использует возможности графических процессоров Turing для удаления фоновых шумов из трансляции, голосовых чатов и видеоконференций. Сейчас доступна бета версия этого плагина. В описании говорится, что в RTX Voice используются «функции ИИ», помогая увеличить качество звука.

Настройка плагина RTX Voice

Плагин RTX Voice поддерживает целый ряд приложений для общения, включая OBS Studio, XSplit Broadcaster, XSplit Gamecaster, Twitch Studio, Discord, Google Chrome, WebEx*, Skype*, Zoom* и Slack* (приложения, отмеченные «*» могут иметь некоторые проблемы с RTX Voice).

Установка микрофона RTX Voice

При включении плагина можно избавиться от фоновых звуков, включая щелчки от клавиатуры, шум от других геймеров, сидящих рядом и прочего окружения.

Чтобы воспользоваться плагином нужно иметь видеокарту NVIDIA GeForce RTX или Quadro RTX, драйвер версии 410.18 или новее, операционную систему Windows 10. После установки RTX Voice её нужно выбрать в качестве микрофона в приложении для конференции.

Несмотря на эти требования многие обозреватели уже отметили, что плагин прекрасно работает и на видеокартах без RTX.

Системы распознавания речи понимают только белых

Системы распознавания речи от пяти крупнейших технологических компаний, включая Amazon, Apple, Google, IBM и Microsoft, пытаясь понять чёрных людей допускают огромное количество ошибок.

В исследовании, опубликованном в журнале «Труды Национальной академии наук» США, указывается, что системы распознавания речи в среднем ошибочно понимают 19% слов, произносимых белыми людьми. С чёрными этот процент возрастает до 35. В то же время объём вовсе нераспознанного текста в речи белых составляет 2%, а у чёрных — 20%.

Исследование, проведённое в Стэнфорде, показывает, что такое количество ошибок может быть связано с порядком обучения искусственного интеллекта. Задачи по обучению ставят в основном белые люди, и относительно редко — чёрные.

Наилучшая система, от Microsoft, неправильно распознавала 15% слов произнесённых белыми, и 27% — чёрными. Худшая из протестированных систем, от Apple, показала уровень ошибок в 23% для белых и 45% для чёрных.

Sony выпускает средство написания музыки на базе ИИ

Sony Computer Science Laboratories (Sony CSL) запустила сервис создания музыки с применением искусственного интеллекта, который получил название FlowMachines.

В его основе лежит Flow Machines Profession (FM Pro), которая интегрирует человеческую креативность с рекомендациями системы искусственного интеллекта, который предлагает мелодии, аккорды и ритм, позволяя с лёгкостью создавать мелодии по вкусу автора.

FlowMachines Pro с искусственным интеллектом

Система FM Pro достигает этого, выражая стиль и ритм песни с помощью Style Palette, которая является моделью машинного обучения, анализирующей данные подготовленные Sony CSL. Для её использования необходимо запустить плагин FlowMachines Pro на цифровой звуковой рабочей станции (DAW — Digital Audio Workstation) и выбрать палитру стилей основываясь на последовательности аккордов создаваемой песни. После этого пользователь нажимает кнопку «создать», и Style Palette предложит несколько вариантов мелодий с аккомпанементом и ритмом на основе выбранной последовательности аккордов.

Если предложенные варианты удовлетворяют автора, то он просто перетягивает трек в DAW. Если нет — то нужно снова создать мелодию, чтобы получить новые предложения. После выбора аккордов, вся музыкальная информация может быть отображена в виде данных MIDI.

NVIDIA выпускает Deep Learning Super Sampling 2.0

Компания NVIDIA анонсировала вторую версию средства повышения масштабирования DLSS.

В основе DLSS 2.0 лежит нейронная сеть, которая использует яра NVIDIA RTX Tensor Core для повышения частоты кадров и генерации резких кадров, качество которых соответствует или превышает рендер в родном разрешении.

Технология была обучена на десятках тысяч изображений с высоким разрешением. После обучения, искусственный интеллект в DLSS 2.0 может брать изображения с низким разрешением и конструировать изображения с высоким разрешением.

Сравнение изображения с включённой и выключенной DLSS

Производительность, при использовании Tensor Core, может достигать 110 терафлопс. При этом DLSS 2.0 работает вдвое быстрее предшественника. По словам NVIDIA, имеется возможность одновременной работы 3D игры и сети с глубоким обучением в реальном времени. Более того, DLSS 2.0 используется специальные техники, которые позволяют обсчитывать только четверть или половину пикселей, сохраняя качество, сравнимое с родным разрешением.

Первая версия DLSS использовала специально обученные алгоритмы для каждой игры. Вторая версия позволяет не привязываться к конкретной игре. Она доступна для всех игр.

NVIDIA DLSS 2.0 | A Big Leap In AI Rendering

Технология DLSS 2.0 имеет три режима качества игрового рендера: Quality, Balanced и Performance. В последнем режиме масштабирование осуществляется в 4 раза, с 1080p до 4K.

Alibaba разработала ИИ для диагностики короновирусной пневмонии

Группа Alibaba разработала искусственный интеллект, способный выявлять заболевание пневмонией, вызванной новой короновирусной инфекцией с точностью 96%. Эта диагностическая система будет поставлена в более чем 100 больниц.

Сообщается, что ИИ может умеет отличать случаи вирусной и COVID-19 пневмонии с точностью 96% при анализе снимков компьютерной томографии. Это не только точнее, но и быстрее, чем делают люди, поскольку на диагностику уходит около 20 секунд.

Исследователи обучили ИИ на более чем пяти тысячах подтверждённых случаях пневмонии, вызванной COVID-19. Также в работе используются «последние инструкции и недавно опубликованные исследования».

Благодаря новой разработке, китайские больницы смогут быстрее выявлять инфицированных людей, что в свою очередь, может замедлить распространение инфекции.

Европа готовит первый прототип собственного процессора

Европейский проект European Processor Initiative (EPI), призван наладить выпуск заказных процессоров, которые найдут применение в ЕС в различных моделях использования.

Первой задачей EPI стало создание заказного процессора для высокопроизводительных расчётов, таких как машинное обучение. И при создании прототипа разработчики пошли своим путём. Глава совета EPI Жан-Марк Денис в интервью Next Platform рассказал некоторые сведения о готовящимся чипе.

Согласно представленным данным, производиться процессор будет по 6 нм технологии на заводах TSMC (TSMC N6 EUV), а первые образцы будут готовы к концу года, и он будет гетерогенным. Это значит, что на ядре 2.5D будут присутствовать различные разработки. Процессор получит заказной CPU архитектуры ARM. Он будет основан на поколении Zeus серверных ядер Neoverese. Это ядро будет применяться для общих задач, например, запуска ОС. Для специальных целей чип получит ядра Titan — процессор на базе архитектуры RISC-V, которая использует векторную и тензорную обработку для задач искусственного интеллекта. Этот CPU будет использовать все современные стандарты, включая FP32, FP64, INT8 и bfoat16. Система будет использовать память HBM, которая разместится в CPU Titan. Для общих целей будут присутствовать связи DDR5, а внутренние связи будут реализованы посредством шины PCIe 5.0.

На горизонте засветилась видеокарта Radeon Instinct MI100 Arcturus

Новая видеокарта эпохи пост-Navi с кодовым именем Arcturus дебютирует в виде ускорителя Radeon Instinct MI100, предназначенного для AI-ML. Сама AMD назвала его «Серверный акселератор». Сайт TechPowerUp заполучил BIOS этой видеокарты, и вот что он о ней узнал.

Идентификатор устройства обозначен как «0x1002 0x738C». Отмечается, что объём памяти HBM2 составит 32 ГБ, а частота — 1000 МГц. Если компания использует шину шириной 4096 бита, то пропускная способность может достигать 1 ТБ/с.

В строке идентификатора также имеется запись «MI100 D34303 A1 XL 200W 32GB 1000m». Это значит, что тепловыделение составит лишь 200 Вт. Учитывая, что карта будет иметь 128 CU и 8192 шейдеров, это заметное снижение. Для сравнения, карта Radeon Instinct MI60 с 4096 шейдерами имеет TDP в 300 Вт. Это значит, что AMD удалось невероятно увеличить энергоэффективность в Arcturus.

Ускоритель рассчётов Radeon Instinct MI60

Что касается частот работы видеокарты, то они обозначены как 1334 МГц, 1091 МГц и 1000 МГц. Как правило, инженеры AMD располагают их в следующем порядке: частота GPU, частота SOC и частота памяти. Таким образом, частота GPU составит 1334 МГц, заметно ниже Navi и Vega. Возможно, снижение частоты необходимо для повышения энергоэффективности.

Карта Arcturus откроет новую серию ускорителей AMD. Вначале это будет серия ИИ-ускорителей, затем будет представлен продукт Radeon Pro, а затем появится и клиентское решение. При этом Arcturus — это не обещанный «big Navi». Карта куда больше похожа на Vega, чем на Navi.

Intel отказывается от процессоров Nervana

Компания Intel приняла решение отказаться от нейронного процессора Nervana в угоду чипам, разрабатываемым Habana Lab.

Аналитик Moor Insights & Strategy Карл Фройнд сообщил Forbes, что компания Intel прекратила разработку обоих процессоров Nervana NNP-T для обучения и Nervana NNP-I для связи, однако решение ещё может измениться и на него может повлиять мнение комьюнити.

Что касается Habana, которую Intel приобрела пару месяцев назад, то она разрабатывает два чипа для ИИ, называемые Habana Gaudi и Habana Goya. Первый из них является высокоспециализированным чипом для тренировки нейронных сетей. Что касается Goya, то он необходим для активного развёртывания и эксплуатации нейронных сетей.

Интерференсный процессор Habana Goya

В Intel отмечают, что оба процессора Habana служат более-менее тем же целям, что и собственные разработки. Однако чипы Nervana оказались хуже Habana. Фройнд отметил, что ему «трудно представить» сценарий, где процессоры Nervana смогут сыграть важную роль в портфеле Intel.

Согласно бенчмаркам, два процессора Nervana NNP-I в тесте ResNet-50 продемонстрировали 10567 вводов в секунду, в то же время один чип Habana Goya выдаёт 14451 ввод в секунду. Кроме того, Goya уже поставляется клиентам с 2018 года, а NNP-I пока ещё не выпущен.

Google Translate получит синхронное стенографирование

Компания Google сообщила, что приложение Google Translate для Android получит возможность синхронного стенографирования речи. Данный функционал был продемонстрирован в офисе компании, а одно из мероприятий, посвящённое развитию искусственного интеллекта.

Инструмент будет стенографировать речь, как будто она записана пользователем на другом языке. Пока функция является прототипом и может работать лишь онлайн.

Google Translate

Функция работает только с произносимой речью, захваченной через микрофон смартфона и не поддерживает обработку ранее записанных файлов. При этом никто не запрещает воспроизвести этот файл через громкоговоритель и позволить расшифровать его на лету. В новом инструменте Google Translate будет получать целое предложение по мере захвата аудио. Это позволит корректировать пунктуацию и лучше подбирать слова. В дополнение, инструмент будет исправлять акценты и региональные диалекты.

В Google отмечают, что новая функция не даст идеальный перевод в текст. Однако ИИ будет обучаться, и по мере её использования качество перевода будет улучшаться. О том, когда функция появится в приложении Google Translate пока не сообщается.