Новости про тензорные ядра

Стали известные полные характеристики NVIDIA TU102

Видеокарта GeForce RTX 2080 Ti основана на графическом процессоре TU102. В ходе презентации на Gamescom компания сообщила некоторые характеристики GPU, но теперь появилась более детальная информация.

Оказалось, что GPU содержит ядра разных типов. Также нашему вниманию представлена блочная диаграмма GPU, при беглом взгляде на которую кажется, что GPU мало отличается от предшественников. Однако на самом деле каждый из 72 потоковых процессоров содержит не только ядра CUDA, но и ядра RT и тензорные ядра.

NVIDIA GeForce RTX 2080 Ti
NVIDIA GeForce RTX 2080 Ti

Чипсет TU102 разделён на 6 GPC (graphics processing clusters), каждый из которых содержит 12 SM. В каждом потоковом мультипроцессоре размещаются 64 ядра CUDA, 8 ядер Tensor и 1 ядро RT. Каждый из кластеров также содержит шесть геометрических блоков. Кроме того, GPU имеет 288 TMU и 96 ROP.

Блочная диаграмма и спецификации GPU TU102
Блочная диаграмма и спецификации GPU TU102

Процессор работает с памятью GDDR6 по шине шириной 384 бита со скоростью 14 Гб/с. Также имеется поддержка двух каналов NVLink, которые будут использованы в конфигурациями с несколькими GPU.

NVIDIA представила профессиональную карту на базе Turing

Сегодня компания NVIDIA представила первую видеокарту новой архитектуры Turing. Её процессор оснащён специальными ядрами «RT Core» для трассировки лучей, сложной техники, дающей предельно фотореалистичную картинку. Благодаря им эти расчёты теперь могут выполняться в реальном времени.

В компании отметили, что представленная видеокарта Quadro RTX стала «первым GPU для трассировки лучей» и одновременно является крупнейшим прорывом для компании с 2006 года, когда была представлена технология CUDA.

Дзень Хсунь Хуан представляет видеокарту Quadro RTX 8000
Дзень Хсунь Хуан представляет видеокарту Quadro RTX 8000

Даже по названию очевидно, что это будет карта для профессиональной работы. Ускоритель Quadro RTX 8000 будет стоить 10 000 долларов, когда он будет доступен к концу года. Плата будет содержать целых 48 ГБ видеопамяти GDDR6. Её графический процессор получит 4608 ядер CUDA и 576 тензорных ядер. Скорость трассировки лучей названа NVIDIA на уровне 10 гигамассивов в секунду, а общая производительность составит 16 терафлопс. Графический процессор получит интерфейс NVLink, а значит NVIDIA предполагает масштабирование видеокарт. Также из интерфейсов стоит отметить наличие порта VirtualLink, предназначенного для будущих устройств виртуальной реальности.

Анонс видеокарты состоялся в ходе SIGGRAPH, конференции для профессионалов в области компьютерной графики. На следующей неделе ожидается анонс игровых видеокарт на базе GPU Turing. Что это будут за ускорители, по-прежнему остаётся загадкой.