Характеристики NVIDIA GT300/Fermi

После представления архитектуры Fermi на официальном сайте NVIDIA для разработчиков появилось подробное описание характеристик этого нового флагманского графического процессора.

Чип имеет 3 млрд. транзисторов и 512 шейдерных процессоров, которые NVIDIA теперь называет ядрами CUDA. Чип, как и в архитектуре GT200 состоит из кластеров, поэтому компании относительно легко будет создавать чипы для среднего и начального уровня, уменьшая количество этих блоков на кристалле. Fermi имеет 16 кластеров, каждый из которых имеет 32 ядра CUDA.

512 ядер CUDA поддерживают вычисления с плавающей точкой в стандарте IEEE 754-2008, превосходя в этом отношении даже центральные процессоры. При этом скорость исполнения арифметических операций с двойной точностью до 8 раз превосходит предыдущее поколение графических процессоров NVIDIA в лице GT200.

Следующая инновация — 1 Мб кэш-памяти L1, разделенного по 16 Кб, а также распределённая кэш-память L2 объёмом 768 Кб. Иерархическая кэш-память в GPU ускоряет алгоритмы вроде расчётов физических процессов, трассировки лучей и умножения разряжённых матриц, где адреса данных заранее не известны.

Видеопамять работает через 384-битную шину данных. Чип поддерживает память GDDR5 объёмом 1,5 Гб, 3 Гб и 6 Гб. Процессор понимает код C++ без необходимости его обработки драйвером и, конечно, поддерживает DirectX 11. Fermi поддерживает память с ECC (кодом корректировки ошибок), что критично для центров данных и суперкомпьютеров, развёртывающих большие массивы GPU.

Движок GigaThread Engine будет поддерживать одновременное исполнение задач нескольких программных ядер в рамках одного приложения (к примеру, одновременный расчёт физики жидкостей и твёрдых тел).

В результате можно сказать, что новый графический процессор NVIDIA очень похож на центральный процессор. Компания идёт путём, обратным подходу AMD Fusion, который предполагает интеграцию GPU на кристалл центрального процессора.