Новости про NVIDIA, графические процессоры и суперкомпьютеры

NVIDIA скоро изготовит мультичиповый GPU Hopper

В Сети появились слухи, что в скором времени NVIDIA изготовит новый GPU под именем Hopper. Тут важно отметить, что это не игровое решение, и вы не увидите карту GeForce RTX 4080 Ti на его основе. Тем не менее, это инновационное решение.

В Twitter, в аккаунте Greymon55, появилось шифрованное сообщение с аббревиатурой «NHWTOS», которая через пару часов была расшифрована. Она гласит «NVIDIA's Hopper Will Tape Out Soon», то есть «NVIDIA Hopper скоро будет отпечатан».

Эта новая архитектура примечательна тем, что в ней используется мультичиповый модуль, вместо традиционного монолитного. И хотя этот процессор предназначен для суперкомпьютеров, нам он интересен по причине того, что его опыт может быть применён на поколении Lovelace или даже обновлённой версии Ampere, который планируются в 2024 и 2022 годах соответственно.

Переход от монолитной структуры GPU к мультичиповой

Мультичиповая технология в Hopper аналогична той, что использует AMD в своих центральных процессорах Zen и графических процессорах RDNA. Она изготавливает свои процессоры на TSMC, и новый чип NVIDIA также должен быть изготовлен на TSMC по 5 нм нормам. Ожидается, что чиплет из двух ядер GPU предложит в сумме 288 потоковых мультипроцессоров, что в 2,6 раза больше, чем у GPU NVIDIA A100. Кроме того, Hopper будет более энергоэффективным, чем Ampere. Считается, что его энергетическая эффективность вырастет в 3 раза.

Как обычно, к подобным слухам следует относиться с большой осторожностью и скептицизмом. Тем более, что они получены из неизвестных источников.

NVIDIA ускорила свой «самый большой в мире GPU»

В ходе GTC 2018 исполнительный директор NVIDIA Дзень-Хсунь Хуан, или как его традиционно зовут Дженсен, представил миру самый большой GPU, систему для вычислений под названием DGX-2.

Этот сервер содержит 16 графических процессоров Tesla V100 и 512 ГБ видеопамяти HBM2, образуя вместе один гигантский графический процессор с общей памятью. Вся эта мощь предназначена для центров обработки данных и искусственного интеллекта, и теперь DGX-2 стал чуточку быстрее за счёт повышения лимитов энергопотребления.

Ускоритель NVIDIA DGX-2 на базе процессоров Tesla V100

Изначально энергопотребление Tesla V100 декларировалось на уровне от 300 Вт до 350 Вт. Теперь же лимит поднят до 450 Вт. Процессоры сервера также стали другими. Вместо Intel Platinum 8168 компания установила куда более быстрый Intel Platinum 8174.

Ускоритель NVIDIA DGX-2 на базе процессоров Tesla V100

Увеличение лимита подняло общее энергопотребление системы с 10 кВт до 12 кВт. Производительность же возросла с 2 петафлопс до 2,1 петафлопса. Не сильно впечатляет. Однако повышение частоты GPU должно значительно поднять производительность, так что в таком случае повышение энергопотребление может оказаться вполне оправданным.

Цена не первую версию DGX-2 составляла 400 000 долларов. Изменится ли стоимость теперь — пока неизвестно.

NVIDIA представила ускоритель Tesla K40

В ходе конференции SC13 компания NVIDIA представила самый производительный в мире видеоускоритель Tesla K40, сделав это вслед за AMD Firepro S10000 12 GB.

Как и положено ускорителям Tesla, он предназначен для суперкомпьютеров и он на целых 40% превышает по производительности Tesla K20X. Кроме того, этот ускоритель в 10 раз быстрее самого быстрого на сегодня CPU. Таким образом, ускоритель Firepro S10000 12 GB пробыл на вершине всего несколько дней.

«GPU ускорители стали мейнстрим продуктом в высокопроизводительных ПК и суперкомпьютерах, позволяя инженерам и учёным создавать новшества и делать научные открытия», — заявил Сумит Гупта, главный менеджер NVIDIA по продуктам ускоренных вычислений.

Что касается аппаратной части, то K40 получил 2880 ядер CUDA с базовой частотой 745 МГц и до 875 МГц в режиме Boost, в то время как прошлое поколение, K20X, имело 2688 ядер частотой 732 МГц. В новой плате также используется более быстрая память GDDR5 частотой 3 ГГц, объём которой также как и противоборствующего лагеря составляет 12 ГБ.

В пресс-релизе компания указала, что  «ускоритель Tesla K40 обходит остальные ускорители по двум главным показателям вычислительной производительности: 4,29 терафлопса с обычной точностью и 1,43 терафлопса пиковой производительности с двойной точностью». Надо сказать, что это не совсем правда, поскольку AMD удалось сделать свой ускоритель с производительностью в 1,48 терафлопса при двойной точности вычислений.

Несмотря на недавний анонс, у NVIDIA уже есть первый клиент на новые платы. Им стал Техасский современный вычислительный центр в Остине, который планирует запустить новую интерактивную систему удалённой визуализации и анализа данных, под именем Maverick, уже в январе будущего года.