Новости за 18 сентября 2010 года

CUDA Toolkit 3.2 в свободном доступе

Плюс новые экспериментальные драйверы.

NVIDIA CUDA logo

NVIDIA открыла свободный доступ к анонсированному на этой неделе CUDA Toolkit 3.2. С сайта компании для разработчиков можно загрузить полный комплект средств разработки и документации для новой версии CUDA без необходимости в регистрации. Там же опубликованы драйверы для разработчиков с поддержкой CUDA 3.2: 260.61 для Windows, 260.24 для Linux и 3.2.8 для MacOS. К сожалению, новая версия 1.5 Parallel Nsight с поддержкой Microsoft Visual Studio 2010 пока остается под регистрацией.

Новый скандал с заточками в драйверах ATi

Действительно ли новые версии драйверов Catalyst используют обман приложений для роста производительности в бенчмарках?

С получением образцов видеокарт GeForce GTS 450 обозреватели сайтов отметили в прилагающемся Reviewer`s Guide наличие следующих фраз:

Important note if you are testing the following applications:

  • Dawn of War 2
  • Empire Total War
  • Need for Speed: Shift
  • Oblivion
  • Serious Sam II
  • Far Cry 1

AMD has admitted that performance optimizations in their driver alters image quality in the above applications. The specific change involves demoting FP16 render targets to R11G11B10 render targets which are half the size and less accurate. The image quality change is subtle, but it alters the workload for benchmarking purposes. The correct way to benchmark these applications is to disable Catalyst AI in AMD's control panel. Please contact your local AMD PR representative if you have any doubts on the above issue.

NVIDIA's official driver optimization's policy is to never introduce a performance optimization via .exe detection that alters the application's image quality, however subtle the difference. This is also the policy of FutureMark regarding legitimate driver optimizations.

NOTE: If you wish to test with Need for Speed: Shift or Dawn of War 2, we have enabled support for FP16 demotion - similar to AMD - in R260 drivers for these games. By default, FP16 demotion is off, but it can be toggled on/off with the AMDDemotionHack_OFF.exe and AMDDemotionHack_ON.exe files which can be found on the Press FTP.

For apples-to-apples comparisons with our hardware versus AMD, we ask that you run the AMDDemotionHack_ON.exe when performing your graphics testing with these games. In our own internal testing, speedups of up to 12% can be seen with our hardware with FP16 demotion enabled.

Из текста следует, вкратце, что драйвер AMD Catalyst втихую подменяет формат FP16 (вероятно, подразумевается D3DFMT_A16B16G16R16F, 16-бит на компоненту + 16-бит альфа-канал) на существенно менее точный DXGI_FORMAT_R11G11B10_FLOAT (11+11+10-бит на компоненты, без альфа-канала) при рендеринге в приложениях из списка. За счёт этого достигается преимущество в быстродействии — до 12% в тестах NVIDIA. Всячески не желая быть причастной к подобным махинациям NVIDIA, тем не менее, снабдила обозревателей специальным средством для включения аналогичного снижения качества на своём оборудовании.

Представитель австралийского отделения AMD подтвердил, что использование формата с уменьшенной стоимостью хранения применяется для экономии полосы пропускания видеопамяти, и при сохранении динамического диапазона HDR это вполне оправданная альтернатива. На сайте NVIDIA даже доступен документ (PDF), страница 11 которого расписывает преимущества данного формата.

Сайт Atomic провёл собственное исследование влияния данной оптимизации на результаты видеокарт NVIDIA и ATI, и выявил весьма заметную разницу в производительности:

Atomic FarCry Benchmark

Atomic WH40K:DoWII Benchmark

Однако, поиски влияния на качество графики результата практически не дали, кроме некоторого снижения качества водной поверхности и отражений в FarCry.

Краткий опрос представителей AMD и NVIDIA обозревателями Atomic показал, что AMD ничего плохого в снижении качества для считанных игр не видит и считает это не большим прегрешением, чем «хаки» драйвера NVIDIA для применения FSAA в неподдерживающих сглаживание играх. Представитель NVIDIA же почти дословно воспроизвёл фразы о позиции NVIDIA и Futuremark из исходного Reviewer`s Guide. 

От себя добавим, что реакция общественности, мягко говоря, запоздала. Подобное предупреждение содержится во всех NVIDIA Reviwer`s Guide еще с весеннего выхода Fermi.

NVIDIA Fermi reviewer`s guide cite

GPU Caps Viewer версии 1.9.2

Новая версия информационно-диагностической утилиты от автора FurMark.

В приуроченной к выходу видеокарт GeForce GTS 450 версии 1.9.2 программы GPU Caps Viewer был слегка улучшен интерфейс закладки информации об OpenGL, обновлено приложение мониторинга GPU Shark и исправлена опечатка.

GPU Caps Viewer 1.9.2

Загрузить последнюю версию утилиты можно с официального или нашего сайта (~4 Мб).