Новости про NVIDIA и суперкомпьютеры

NVIDIA готовит GPU H100 с 94 ГБ памяти

Похоже, что графический процессор H100 от NVIDIA, ориентированный на вычисления и искусственный интеллект, скоро получит обновление.

Процессор H100 — это самое производительное предложение, доступное в нескольких вариантах: H100 PCIe, H100 SXM и H100 NVL (со спаренным GPU). Сейчас H100 оснащён 80 ГБ оперативной памяти HBM2E, как в версии PCIe, так и SXM5. Лишь версия H100 NVL оснащается 188 ГБ HBM3, что означает спаренную карту с 94 ГБ памяти. Однако в скором времени, NVIDIA может выпустить одиночные версии акселератора с 94 ГБ и 64 ГБ памяти, о чём гласят свежие записи в PCI ID Repository.

Ускорители NVIDIA H100

В PCI ID Repository появились две записи: «Очень прошу добавить H100 SXM5 64 GB в 2337» и «Очень прошу добавить H100 SXM5 94 GB в 2339». Это означает, что NVIDIA может готовить новые версии H100.

В сентябре 2022 года появились сообщения, будто NVIDIA готовит вариацию H100 со 120 ГБ памяти, однако официального подтверждения этому так и не появилось. Вполне возможно, что соответствующие PCIe ID появились исключительно в лабораториях, куда соответствующее оборудование передавалось на тестирование. Будут ли новые версии доступны в продаже, покажет только время.

NVIDIA и AMD ограничены в поставках GPU в Китай и Россию

Соединённые Штаты Америки начали очередной виток по ограничению доступа Китая и России к высоким технологиям, запретив AMD и NVIDIA поставлять GPU для создания суперкомпьютеров.

Теперь американское правительство ввело специальные лицензионные ограничения для NVIDIA на поставки A100 и H100. Компания отмечает, что под новые ограничения попадают «DGX или любые другие системы, которые включают интегрированные цепи A100 или H100».

Графические процессоры A100 были выпущены NVIDIA в 2020 году. Они предназначены для машинного обучения и основаны на архитектуре Ampere. Более совершенные GPU H100, выпущенные в марте, основаны на Hopper. Под ограничение попадают все процессоры A100, и иные, которые обладают большей пиковой производительностью и производительностью ввода-вывода.

Ускоритель NVIDIA A100

Аналогичные ограничения касаются и AMD. Компания сообщила, что она получила те же требования по лицензионным ограничениям. Под них попадают чипы AMD MI250, а вот линейка MI100 не должна попасть в этот ряд. Китайское подразделение AMD сообщило местному изданию IC Smart, что новое указание правительства США касается ограничений по производительности операций с плавающей запятой двойной точности. Также эти ограничения подтвердили китайские компании Baidu, Tencent и ByteDance.

Целью всех этих ограничений является желание правительства США ограничить возможности Китая и России в создании систем искусственного интеллекта гражданско-военной направленности, которые затем могут быть использованы сугубо для милитаристских целей.

Meta готовит самый быстрый в мире суперкомпьютер

Компания Meta, до недавнего времени называвшаяся Facebook, представила миру новый суперкомпьютер AI Research SuperCluster (RSC), который будет использоваться для создания метавселенных.

Когда он будет закончен, это будет самый быстрый суперкомпьютер. Но даже на первом этапе строительства он займёт пятое место в мире. Компания отмечает, что следующее поколение искусственного интеллекта будет разблокировано мощным суперкомпьютером, который сможет выполнять квантиллионы операций в секунду, с чем и может справиться RSC.

Суперкомпьютер RSC у Meta

Главной целью использования RSC Meta считает построение лучших моделей ИИ, которые будут обучены на основе миллионов примеров. Компания отмечает, что подобные технологии будут иметь важное значение для метавселенных, и Meta сейчас придаёт им большое внимание, поскольку считает, что приложения и продукты на основе ИИ будут играть важную роль.

Что касается аппаратной составляющей, то суперкомпьютер RSC основан на 760 системах NVIDIA DGX A100, которые в сумме содержат 6080 GPU. Каждый из этих GPU связывается при помощи двухуровневой Clos-ткани NVIDIA Quantum 200 Gb/s InfiniBand. Для хранения данных используется массив Pure Storage FlashArray объёмом 175 ПБ и 46 ПБ кэша в системах Penguin Computing Altus. Также предусмотрены 10 ПБ во Pure Storage FlashBlade. Однако уже к концу года число ускорителей вырастет в 2,5 раза до 16 000 GPU.

Использоваться на этой машине будет собственное ПО PyTorch AI, поскольку, по мнению компании, оно обеспечивает наиболее продуктивную среду для разработчиков.

NVIDIA скоро изготовит мультичиповый GPU Hopper

В Сети появились слухи, что в скором времени NVIDIA изготовит новый GPU под именем Hopper. Тут важно отметить, что это не игровое решение, и вы не увидите карту GeForce RTX 4080 Ti на его основе. Тем не менее, это инновационное решение.

В Twitter, в аккаунте Greymon55, появилось шифрованное сообщение с аббревиатурой «NHWTOS», которая через пару часов была расшифрована. Она гласит «NVIDIA's Hopper Will Tape Out Soon», то есть «NVIDIA Hopper скоро будет отпечатан».

Эта новая архитектура примечательна тем, что в ней используется мультичиповый модуль, вместо традиционного монолитного. И хотя этот процессор предназначен для суперкомпьютеров, нам он интересен по причине того, что его опыт может быть применён на поколении Lovelace или даже обновлённой версии Ampere, который планируются в 2024 и 2022 годах соответственно.

Переход от монолитной структуры GPU к мультичиповой

Мультичиповая технология в Hopper аналогична той, что использует AMD в своих центральных процессорах Zen и графических процессорах RDNA. Она изготавливает свои процессоры на TSMC, и новый чип NVIDIA также должен быть изготовлен на TSMC по 5 нм нормам. Ожидается, что чиплет из двух ядер GPU предложит в сумме 288 потоковых мультипроцессоров, что в 2,6 раза больше, чем у GPU NVIDIA A100. Кроме того, Hopper будет более энергоэффективным, чем Ampere. Считается, что его энергетическая эффективность вырастет в 3 раза.

Как обычно, к подобным слухам следует относиться с большой осторожностью и скептицизмом. Тем более, что они получены из неизвестных источников.

NVIDIA выпускает Jetson Xavier NX

Компания NVIDIA выпустила новый ускоритель, который она назвала «самым маленьким и мощным суперкомпьютером ИИ для роботов и передовых встраиваемых вычислительных устройств».

Будучи меньше кредитной карты, энергоэффективный модуль Jetson Xavier NX обеспечивает производительность серверного уровня, до 21 триллиона операций в секунду при современной ИИ-нагрузке. При этом он потребляет лишь 10 ватт.

Модуль NVIDIA Jetson Xavier NX

В качестве сферы применения, разработчики называют малые коммерческие роботы, дроны, средства оптического контроля, сетевые видеорекордеры, портативные медицинские устройства и прочие промышленные системы интернета вещей.

Характеристики Jetson Xavier NX таковы:

  • GPU: Volta с 384 ядрами CUDA cores и 48 ядрами Tensor, плюс 2x NVDLA.
  • CPU: 6-ядер Carmel ARM 64-бит, 6 МБ L2 + 4 МБ L3.
  • Видео: кодирование 2x4K30 и декодирование 2x4K60.
  • Камера: до шести камер CSI (36 через виртуальные каналы); 12 линий (3x4 или 6x2) MIPI CSI-2.
  • Память: 8 ГБ 128-бит LPDDR4X, 51,2 Гб/с.
  • Подключение: Gigabit Ethernet.
  • ОС: Ubuntu Linux.
  • Размер модуля: 70x45 мм.

Модуль Jetson Xavier NX будет доступен с марта 2020 года по цене 400 долларов.

NVIDIA ускорила свой «самый большой в мире GPU»

В ходе GTC 2018 исполнительный директор NVIDIA Дзень-Хсунь Хуан, или как его традиционно зовут Дженсен, представил миру самый большой GPU, систему для вычислений под названием DGX-2.

Этот сервер содержит 16 графических процессоров Tesla V100 и 512 ГБ видеопамяти HBM2, образуя вместе один гигантский графический процессор с общей памятью. Вся эта мощь предназначена для центров обработки данных и искусственного интеллекта, и теперь DGX-2 стал чуточку быстрее за счёт повышения лимитов энергопотребления.

Ускоритель NVIDIA DGX-2 на базе процессоров Tesla V100

Изначально энергопотребление Tesla V100 декларировалось на уровне от 300 Вт до 350 Вт. Теперь же лимит поднят до 450 Вт. Процессоры сервера также стали другими. Вместо Intel Platinum 8168 компания установила куда более быстрый Intel Platinum 8174.

Ускоритель NVIDIA DGX-2 на базе процессоров Tesla V100

Увеличение лимита подняло общее энергопотребление системы с 10 кВт до 12 кВт. Производительность же возросла с 2 петафлопс до 2,1 петафлопса. Не сильно впечатляет. Однако повышение частоты GPU должно значительно поднять производительность, так что в таком случае повышение энергопотребление может оказаться вполне оправданным.

Цена не первую версию DGX-2 составляла 400 000 долларов. Изменится ли стоимость теперь — пока неизвестно.

NVIDIA обновила свой суперкомпьютер на базе GPU

Дженсен Хуан, глава NVIDIA, в ходе GTC представил обновлённую систему машинного обучения, построенную на ускорителе Tesla V100, однако в отличие от прошлогоднего решения, новый модуль содержит 32 ГБ памяти HBM2.

В прошлом году NVIDIA представила суперкомпьютер для искусственного интеллекта DGX-1. Новая модель DGX-2 имеет удвоенное количество процессорных модулей Tesla V100. При этом DGX-2 имеет вдвое больше доступной памяти.

Суперкомпьютерынй модуль NVIDIA DGX-2

Кроме увеличения производительности вычислений и памяти, NVIDIA также обновила и шину связи. Она заменена новой технологией NVSwitch, которая представляет собой ткань интерконнекта, позволяя связывать до 16 GPU и создавать общее пространство памяти. Прошлая версия позволяла объединять только 8 GPU.

По словам разработчиков, технология NVSwitch в 5 раз быстрее PCI-Express, объединённая скорость которой достигает 2,4 ТБ/с.

NVIDIA представила суперкомпьютер Jetson TX2

В ходе Open Compute Summit, прошедшего в калифорнийском Сан-Хосе, компания NVIDIA представила крошечный суперкомпьютер Jetson TX2, который предлагает «вычисления для искусственного интеллекта на передовой».

Система размером с кредитную карту предназначена для промышленных роботов, коммерческих дронов и смарт камер. Новая версия обладает вдвое большей производительностью, по сравнению с предшественником, при энергопотреблении лишь 7,5 Вт.

Компьютер основан на GPU архитектуры Pascal, содержит 8 ГБ памяти LPDDR4, eMMC накопитель объёмом 32 ГБ, модули связи 802.11ac WLAN и Bluetooth. Работает машина под управлением Linux for Tegra. Также Jetson TX2 поставляется с JetPack 3.0, которую NVIDIA называет «наиболее конкурентоспособной SDK для вычислений в области AI, что облегчает интеграцию искусственного интеллекта в широкий спектр приложений».

Дипу Талла, вице-президент и генеральный менеджер бизнеса Tegra в NVIDIA заявил: «Jetson TX2 обеспечивает мощные возможности AI на передовой, позволяя создавать новый класс интеллектуальных машин. Эти устройства обеспечат интеллектуальный анализ видео, что сделает наши города умнее и безопаснее, создание роботов нового типа, которые оптимизируют производство, и нового взаимодействия, которое сделает удалённую работу более плодотворной».

Наборы разработчиков NVIDIA Jetson TX2 начнут поставляться 14 марта.

NVIDIA представила самый энергоэффективный суперкомпьютер

Известный производитель графических процессоров, компания NVIDIA, представила своё новое вычислительное решение DGX SaturnV, которое по мнению компании является наиболее энергоэффективным суперкомпьютером на планете.

Система DGX SaturnV содержит 63 488 ГБ оперативной памяти, 60 512 ядер Intel Xeon E5-2698v4, 125 плат NVIDIA DGX-1 и 100 GPU. По уверению инженеров, DGX SaturnV является 28-м в мире по скорости работы, однако при этом он в 2,3 раза более эффективен, чем Camphore 2, суперкомпьютер, с производительностью равной Xeon Phi Knights Landing.

Компьютер был построен для программы искусственного интеллекта NVIDIA. При этом технология даст огромное преимущество любой компании.

«Поэтому мы собрали самый эффективный в мире и один из самых мощных суперкомпьютеров, чтобы оказать помощь в нашей работе», — отмечена компания.

Суперкомпьютер SaturnV помогает NVIDIA в создании ПО для автомобильного автопилота, который является ключевой частью платформы NVIDIA DRIVE PX 2 для автоматического вождения. Также компания занята обучением нейронной сети для понимания конструирования чипсета и крупномасштабной интеграции. В результате, инженеры компании могут работать быстрее и эффективнее. «Да, мы используем GPU, которые помогают нам создавать GPU». Представитель отметил: «Более важно, что мощь SaturnV даст нам возможность обучать и создавать новые сети глубокого обучения быстрее».

NVIDIA предсказывает общедоступность суперкомпьютеров

В ходе недавней конференции в Остине, штат Техас, исполнительный директор NVIDIA Дзень-Хсунь Хуан рассказал, что видит широкие возможности для распространения суперкомпьютеров во многих отраслях промышленности.

Хуан пояснил, что суперкомпьютерные технологии хорошо продвигаются за пределы традиционных суперкомпьютерных систем, и технологии GPU станут частью будущих технологий, таких как автономные транспортные средства и персональные роботизированные помощники. Компания NVIDIA уже активно работает в этих отраслях, предложив автомобильный компьютер NVIDIA Drive PX и модуль машинного обучения Jetson TX1.

За последние пару лет графические процессоры нашли своё применение во многих суперкомпьютерах. По словам NVIDIA, использование GPU акселераторов в списке top500 суперкомпьютеров растёт ежегодно на 50%, а графический процессор Tesla использован в 23 из 24 новых суперкомпьютерах с GPGPU ускорением.

В будущем машинное обучение увеличит спрос на GPU ещё больше. Машинное обучение является «первоочередным применением высокопроизводительных вычислений для потребителей» — отметил Хуан. «Технология позволит технологии стать автономной в сложности реального мира и станет инструментом для производства автономных транспортных средств и машин, подобных персональным роботам-помощникам».