Новости про суперкомпьютеры

NVIDIA Ampere будет на 75% быстрее нынешних GPU

То, что NVIDIA готовит нечто грандиозное, ни у кого не вызывает сомнений. Ранее ходили слухи, что чипы Ampere будут в полтора раза быстрее GPU. Однако описание нового суперкомпьютера говорит, что Ampere будет ещё быстрее.

Готовящейся к запуску суперкомпьютер Big Red 200 будет содержать ускорители расчётов NVIDIA Ampere. В основе суперкомпьютера лежат невероятные 672 двухсокетных узла. В каждом из них будут работать процессоры AMD EPYC 7742 (по 64 ядра и 128 потоков), что всего составит 86 016 ядер и 172 032 потока.

Суперкомпьютер Big Red 200

Запуск компьютера будет осуществляться в два этапа. В начале, Университет Индианы установит в него ускорители NVIDIA Tesla V100, которые проработают до релиза GPU Ampere. При этом после апгрейда, в нём окажется меньше плат-ускорителей, поскольку Ampere намного производительнее. С переходом на Ampere суперкомпьютер Big Red 200 «получит дополнительные 2 петафлопса производительности, даже с учётом того, что он будет использовать меньшее число GPU, чем Volta V100. Причина уменьшения количества используемых GPU следующего поколения заключается в том, что они просто предлагают на 70—75% большую производительность, чем существующие решения».

На наш взгляд такое сравнение не совсем корректно, ведь апгрейд будет осуществлён не с GPU Turing, а с более старых решений Volta, которые практически не используются в бытовом сегменте.

Как бы то ни было, больше подтверждённой информации мы сможем узнать в марте, когда в ходе GPU Technology Conference (GTC) NVIDIA анонсирует процессоры архитектуры Ampere.

NVIDIA выпускает Jetson Xavier NX

Компания NVIDIA выпустила новый ускоритель, который она назвала «самым маленьким и мощным суперкомпьютером ИИ для роботов и передовых встраиваемых вычислительных устройств».

Будучи меньше кредитной карты, энергоэффективный модуль Jetson Xavier NX обеспечивает производительность серверного уровня, до 21 триллиона операций в секунду при современной ИИ-нагрузке. При этом он потребляет лишь 10 ватт.

Модуль NVIDIA Jetson Xavier NX

В качестве сферы применения, разработчики называют малые коммерческие роботы, дроны, средства оптического контроля, сетевые видеорекордеры, портативные медицинские устройства и прочие промышленные системы интернета вещей.

Характеристики Jetson Xavier NX таковы:

  • GPU: Volta с 384 ядрами CUDA cores и 48 ядрами Tensor, плюс 2x NVDLA.
  • CPU: 6-ядер Carmel ARM 64-бит, 6 МБ L2 + 4 МБ L3.
  • Видео: кодирование 2x4K30 и декодирование 2x4K60.
  • Камера: до шести камер CSI (36 через виртуальные каналы); 12 линий (3x4 или 6x2) MIPI CSI-2.
  • Память: 8 ГБ 128-бит LPDDR4X, 51,2 Гб/с.
  • Подключение: Gigabit Ethernet.
  • ОС: Ubuntu Linux.
  • Размер модуля: 70x45 мм.

Модуль Jetson Xavier NX будет доступен с марта 2020 года по цене 400 долларов.

NVIDIA ускорила свой «самый большой в мире GPU»

В ходе GTC 2018 исполнительный директор NVIDIA Дзень-Хсунь Хуан, или как его традиционно зовут Дженсен, представил миру самый большой GPU, систему для вычислений под названием DGX-2.

Этот сервер содержит 16 графических процессоров Tesla V100 и 512 ГБ видеопамяти HBM2, образуя вместе один гигантский графический процессор с общей памятью. Вся эта мощь предназначена для центров обработки данных и искусственного интеллекта, и теперь DGX-2 стал чуточку быстрее за счёт повышения лимитов энергопотребления.

Ускоритель NVIDIA DGX-2 на базе процессоров Tesla V100

Изначально энергопотребление Tesla V100 декларировалось на уровне от 300 Вт до 350 Вт. Теперь же лимит поднят до 450 Вт. Процессоры сервера также стали другими. Вместо Intel Platinum 8168 компания установила куда более быстрый Intel Platinum 8174.

Ускоритель NVIDIA DGX-2 на базе процессоров Tesla V100

Увеличение лимита подняло общее энергопотребление системы с 10 кВт до 12 кВт. Производительность же возросла с 2 петафлопс до 2,1 петафлопса. Не сильно впечатляет. Однако повышение частоты GPU должно значительно поднять производительность, так что в таком случае повышение энергопотребление может оказаться вполне оправданным.

Цена не первую версию DGX-2 составляла 400 000 долларов. Изменится ли стоимость теперь — пока неизвестно.

Intel отказывается от Xeon Phi

Ускорители Intel Xeon Phi, начавшиеся как проект Larrabee, так и не снискали коммерческого успеха, несмотря на заверения компании, что его программная модель куда более продуктивна, чем x86.

В то же время GPU NVIDIA прекрасно себя чувствует на рынке суперкомпьютеров, доминируя в вычислениях подобного типа. По сути, GPU Volta окончательно вытеснил Xeon Phi с рынка.

Ещё недавно Intel планировала выпуск нового поколения Xeon Phi под названием Knights Hill по 10 нм нормам. Однако задержки с реализацией 10 нм процесса наряду с низким интересом к Phi в целом, привели компанию к закрытию проекта. Сейчас Intel объявляет о прекращении производства восьми поставляемых моделей Xeon Phi.

Ускоритель Intel Xeon Phi

Под сокращение попали модели Xeon Phi 7210, 7210F, 7230, 7230F, 7250, 7250F, 7290 и 7290F. Эти ускорители ставились в сокеты для CPU. Карты расширения, с конструкцией графических плат, отменены достаточно давно.

Примечательно, что причиной сокращения выпуска названо изменение «рыночного спроса на эти продукты, который перешёл на другие решения Intel». Вот только у Intel не осталось решений, на которые можно было перенести спрос. У фирмы нет ничего, что можно было бы предложить в качестве ускорителя вычислений. Единственный шанс компании вернуться на этот рынок — проект нового GPU, который проектирует Раджа Кодури, и который появится лишь в следующем году, при оптимистичном сценарии.

NVIDIA обновила свой суперкомпьютер на базе GPU

Дженсен Хуан, глава NVIDIA, в ходе GTC представил обновлённую систему машинного обучения, построенную на ускорителе Tesla V100, однако в отличие от прошлогоднего решения, новый модуль содержит 32 ГБ памяти HBM2.

В прошлом году NVIDIA представила суперкомпьютер для искусственного интеллекта DGX-1. Новая модель DGX-2 имеет удвоенное количество процессорных модулей Tesla V100. При этом DGX-2 имеет вдвое больше доступной памяти.

Суперкомпьютерынй модуль NVIDIA DGX-2

Кроме увеличения производительности вычислений и памяти, NVIDIA также обновила и шину связи. Она заменена новой технологией NVSwitch, которая представляет собой ткань интерконнекта, позволяя связывать до 16 GPU и создавать общее пространство памяти. Прошлая версия позволяла объединять только 8 GPU.

По словам разработчиков, технология NVSwitch в 5 раз быстрее PCI-Express, объединённая скорость которой достигает 2,4 ТБ/с.

Китай возглавил список 500 самых быстрых суперкомпьютеров

В новом списке лучших 500 суперкомпьютеров, который составляется каждые полгода, лидерство захватил Китай. При этом в этой стране оказалась не только самая производительная система, но и 201 другая система из 500.

Для сравнения, в этом списке 143 суперкомпьютера, расположенных в США. Хотя всего несколько месяцев назад их было 169, а у Китая — 160.

Система HPC, разработанная Китайским национальным исследовательским центром по параллельным вычислением и технологиям, под названием Sunway TaihuLight, возглавила список Top 500. Её производительность достигает 93 петафлопс.

Вторая из рейтинга машина, также расположена в Китае. Компьютер Tianhe-2, установленный в Национальном суперкомпьютерном центре в Гуанчжоу, имеет скорость в 33,9 петафлопс.

Третьим стала швейцарская машина Piz Daint, представляющая собой Cray XC50 с графическими модулями NVIDIAS Tesla P100. Его производительность равна 19,6 петафлопс.

Четвёртый компьютер расположен в Японии. Система Gyoukou из Научного и технологического агентства моря и земли имеет производительность в 19,4 петафлопс. Эта машина является сердцем симуляции Земли.

Суперкомпьютер из США оказался на пятом месте. Машина Titan установлена в национальной лаборатории энергии в Оук-Ридж. Этот суперкомпьютер от Cray может работать со скоростью 17,59 петафлопс.

Cray анонсирует суперкомпьютеры для искусственного интеллекта

Производитель суперкомпьютеров, компания Cray, разработала две новых системы, которые получили название CS-Storm 500GT и 500NX, предназначенные для обеспечения нужд её клиентов в искусственном интеллекте.

Обе системы разработаны с использование GPU NVIDIA Tesla, однако предлагают разный набор возможностей.

У моделей различный объём ОЗУ. И он впечатляет. Суперкомпьютер CS-Storm 500GT поддерживает до 2 ТБ памяти DDR4 (16 DIMM по 128 ГБ), а модель 500NX — 3 ТБ DDR4 (24 DIMM по 128 ГБ). Как и прошлые поколения машин, модель 500GT содержит пару CPU Intel семейства Xeon Skylake, а 500NX — Intel Xeon E5-2600 v4.

Фрэд Кохаут, старший вице-президент Cray по продукции и директор по маркетингу заявил: «Спрос со стороны потребителей на инфраструктуру с возможностями искусственного интеллекта быстро растёт, и выпуск наших систем CS-Storm предоставит нашим клиентам мощное решение по взаимосвязи глубокого обучения и снижению нагрузки на машины в масштабе мощности суперкомпьютера Cray. Экспоненциальный рост объёмов данных, связанный с необходимостью в более быстрых решениях в искусственном интеллекте, отвечает нуждам широко масштабируемой и настраиваемой инфраструктуры».

После того, как на рынке стали появляться быстрые суперкомпьютеры, опережающие решения Cray, у компании начали возникать проблемы с реализацией, но похоже, она нашла себе новый рынок.

NVIDIA представила суперкомпьютер Jetson TX2

В ходе Open Compute Summit, прошедшего в калифорнийском Сан-Хосе, компания NVIDIA представила крошечный суперкомпьютер Jetson TX2, который предлагает «вычисления для искусственного интеллекта на передовой».

Система размером с кредитную карту предназначена для промышленных роботов, коммерческих дронов и смарт камер. Новая версия обладает вдвое большей производительностью, по сравнению с предшественником, при энергопотреблении лишь 7,5 Вт.

Компьютер основан на GPU архитектуры Pascal, содержит 8 ГБ памяти LPDDR4, eMMC накопитель объёмом 32 ГБ, модули связи 802.11ac WLAN и Bluetooth. Работает машина под управлением Linux for Tegra. Также Jetson TX2 поставляется с JetPack 3.0, которую NVIDIA называет «наиболее конкурентоспособной SDK для вычислений в области AI, что облегчает интеграцию искусственного интеллекта в широкий спектр приложений».

Дипу Талла, вице-президент и генеральный менеджер бизнеса Tegra в NVIDIA заявил: «Jetson TX2 обеспечивает мощные возможности AI на передовой, позволяя создавать новый класс интеллектуальных машин. Эти устройства обеспечат интеллектуальный анализ видео, что сделает наши города умнее и безопаснее, создание роботов нового типа, которые оптимизируют производство, и нового взаимодействия, которое сделает удалённую работу более плодотворной».

Наборы разработчиков NVIDIA Jetson TX2 начнут поставляться 14 марта.

NVIDIA представила самый энергоэффективный суперкомпьютер

Известный производитель графических процессоров, компания NVIDIA, представила своё новое вычислительное решение DGX SaturnV, которое по мнению компании является наиболее энергоэффективным суперкомпьютером на планете.

Система DGX SaturnV содержит 63 488 ГБ оперативной памяти, 60 512 ядер Intel Xeon E5-2698v4, 125 плат NVIDIA DGX-1 и 100 GPU. По уверению инженеров, DGX SaturnV является 28-м в мире по скорости работы, однако при этом он в 2,3 раза более эффективен, чем Camphore 2, суперкомпьютер, с производительностью равной Xeon Phi Knights Landing.

Компьютер был построен для программы искусственного интеллекта NVIDIA. При этом технология даст огромное преимущество любой компании.

«Поэтому мы собрали самый эффективный в мире и один из самых мощных суперкомпьютеров, чтобы оказать помощь в нашей работе», — отмечена компания.

Суперкомпьютер SaturnV помогает NVIDIA в создании ПО для автомобильного автопилота, который является ключевой частью платформы NVIDIA DRIVE PX 2 для автоматического вождения. Также компания занята обучением нейронной сети для понимания конструирования чипсета и крупномасштабной интеграции. В результате, инженеры компании могут работать быстрее и эффективнее. «Да, мы используем GPU, которые помогают нам создавать GPU». Представитель отметил: «Более важно, что мощь SaturnV даст нам возможность обучать и создавать новые сети глубокого обучения быстрее».

ARM включается в гонку суперкомпьютеров

Разработчик микропроцессоров ARM решил вступить в конкурентную борьбу с IBM, Intel и NVIDIA на рынке суперкомпьютеров, анонсировав «масштабируемое векторное расширение» (Scalable Vector Extensions — SVE), технологию, разработанную для архитектуры ARMv8-A.

Данная архитектура уже используется в суперкомпьютере Post-K, который изготавливает Fujitsu для японского института RIKEN. Эта машина, к моменту её запуска в 2020 году, должна стать самым производительным компьютером, демонстрируя скорость обработки в 1000 петафлопс.

Технология SVE была описана в ходе конференции Hot Chips в Купертино. Она способна поддерживать вектора длиной от 128 до 2048 бит. Она предназначена для производителей суперкомпьютеров и позволяет облегчить использование продуктов ARM для построения мощных вычислительных систем. Технология является гибким расширением инструкций ARM, которое позволяет перенести расчёт векторов с программного уровня на аппаратный.

В компании полагают, что модель облачных расчётов будет требовать высокопроизводительных систем, где наиболее мощные суперкомпьютерные процессоры не будут обладать выдающейся производительностью. Отмечается, что уже сейчас десятка самых быстрых суперкомпьютеров работает с CPU частотой от 1,45 ГГц до 2,6 ГГц, а высокая производительность достигается за счёт большого числа ядер и масштабных связей между ними, а не за счёт высокой производительности отдельных компонентов.