Новости про DirectCompute

HairWorks — собственное решение NVIDIA для эмуляции волос и шерсти

Компания AMD сделала неплохой маркетинговый ход, представив свою технологию эмуляции волос и шерсти TressFX. Кроме того, компания пообещала выпустить новую, улучшенную версию этой технологии, и ответ NVIDIA не заставил себя долго ждать.

Конкурентная компания представила свою разработку под названием HairWorks, которая основана на общедоступном API DirectCompute. В видеоролике ниже показано, какова эта технология в реальности. Для примера была показана эмуляция шерсти животных в игре Call of Duty: Ghosts, которая называется Dynamic Fur, и надо отметить, что она весьма хороша.

Впервые технология реалистичного отображения шерсти появилась на E3 2013 для волка в игре Witcher 3, после чего она была улучшена во многих играх, включая тот же Witcher 3, Call of Duty: Ghosts и прочих. Каждый объект шерсти содержит от 400 до 500 тысяч отдельных волосков. Большинство из них создаются динамически на лету с помощью GPU на основе 10 тысяч опорных волос, которые эмулируются и создают основу для дальнейшей тесселяции.

Call of Duty: Ghosts - Dynamic Fur (NVIDIA HairWorks)

AMD выпустила TressFX

Компания Advanced Micro Devices представила новую графическую технологию под названием TressFX, предназначенную для реалистичного рендера волос персонажей в видеоиграх.

Изначально компания обещала провести некую презентацию, слухи о которой робко предполагали, что компания представит обещанную ранее новую видеокарту, нацеленную на более плотную конкуренцию с NVIDIA. Другие же, увидев изображение волос, вообще в шутку предполагали, что компания готовит новый шампунь (что и не мудрено после рекламы «таблеток» для оверклокинга).

На самом же деле фирма представила технологию, которая существенно улучшит отображение волос в видеоиграх на платформе PC, а это, в свою очередь, выведет игры на новый уровень реализма.

Для демонстрации работы технологии в AMD решили использовать изображения Лары Крофт из возрождённого проекта Tomb Raider. Были представлены иллюстрации, позволяющие сравнить вид волос при традиционном рендере и при отрисовке с использованием технологии TressFX. Надо сказать, что изображения впечатляют, и волосы действительно выглядят натуральными. Правда, это не рядовой эффект, и для его достижения разработчикам AMD пришлось тесно работать с программистами из Crystal Dynamics.

По уверениям компании, технология TressFX основана на общедоступной среде GPGPU DirectCompute, и будет доступна для всех владельцев видеокарт модельного ряда Radeon HD 7000. Но не стоит забывать, что эта технология, наверняка, будет работоспособна лишь в играх, разработчики которых имеют совместные программы сотрудничества с AMD. С другой стороны, учитывая основу технологии, нет причин не предположить её работоспособность и на видеоускорителях NVIDIA.

Capcom анонсировала превью своего нового хита Lost Planet 2 и одноименный DX11 бенчмарк

На днях Capcom анонсировала превью своего нового хита Lost Planet 2 и одноименный DX11 бенчмарк.

Бенчмарк состоит из 2 тестов:

  1. variable gameplay test, который даст общее впечатление об игре
  2. deterministic benchmark, который может пригодиться для тестирования производительности топовых GPU с поддержкой DX11.
В режиме DX11 Lost Planet 2 позволяет увидеть реализацию следующих технологий:

  • тесселяция и наложение карт смещения при прорисовке воды, боссов и других персонажей
  • расчет динамики мягких тел при прорисовке боссов
  • симуляция динамики волн на DirectCompute и др.

Бенчмарк доступен для скачивания и каждый может протестировать свое железо. Для счастливых обладателей систем, способных осилить технологию 3D Vision и Surround/3D Vision, компания NVIDIA предлагает новый тестовый драйвер версии CD v1.33. Настоящая версия не содержит профиль для SLI в Lost Planet 2 – он будет добавлен позже, к моменту выхода полной версии игры 15 октября 2010.

Доступен для загрузки бета драйвер NVIDIA GeForce 258.69

NVIDIA выпустила бета драйвер GeForce 258.69 с массой изменений и увеличением производительности во многих играх. Этот пакет драйверов поддерживает настольные видеокарты GeForce серий 6/7/8/9/100/200/300/400, а также ION.

Новое в этой версии драйверов:

  • добавлена поддержка Blu-Ray с 3D технологией NVIDIA 3D Vision;
  • увеличена производительность серии GeForce GTX 400 в нескольких играх. Ниже приведены примеры некоторых из наиболее значительных улучшений, измеренные для GeForce GTX 480. Результаты будут варьироваться, в зависимости от графического процессора и конфигурации системы:
    • до 14% в Aliens vs. Predator (1920*1200 без AA/AF — тесселяция вкл.);
    • до 4% в Batman: Arkham Asylum (1920*1200 4xAA/16xAF PhysX = выс.);
    • до 5% в BattleForge (1920*1200 4xAA/16xAF — очень высокие настройки);
    • до 5% в Call Of Duty: Modern Warfare 2 (1920*1200 4xAA/16xAF);
    • до 4% в Crysis: Warhead (1920*1200 4xAA/16xAF — настройка для энтузиастов);
    • до 24% в Enemy Territory: Quake Wars (1920*1200 без AA/AF);
    • до 9% в Far Cry 2 (2560*1600 8xAA/16xAF);
    • до 25% в Just Cause 2 (2560*1600 без AA/AF — Concrete Jungle);
    • до 7% в Метро 2033 (1920*1200 без AA/16xAF — тесселяция вкл.);
    • до 40% в Метро 2033 на SLI ((1920*1200 4xAA/16xAF — тесселяция вкл.);
    • до 8% в STALKER: Зов Припяти (1920*1200 не AA/AF — день);
    • до 110% в Stone Giant на SLI (2650*1600 — тесселяция вкл, DoF вкл.);
    • до 6% в The Chronicles of Riddick: Dark Athena (2560*1600 без AA/AF);
    • до 9% в Unigine: Tropic (2560*1600 без AA/AFOpenGL);
    • до 5% в 3DMark Vantage (Extreme производительность);
    • до 19% с Transparency АА (1920*1200 4xTrSS — измеряется в Crysis);
  • добавлена поддержка OpenGL 4.0 для серии GeForce GTX 400;
  • добавлена поддержка CUDA Toolkit 3.1, который включает значительное увеличение производительности для двойной точности в математических операциях;
  • добавлена поддержка новых режимов сглаживания для 3-Way SLI, в том числе до SLI48x АА на GeForce серии 200, и до SLI96x AA для GeForce GTX 400 серии;
  • добавлена поддержка нового режим качества NVIDIA Ambient Occlusion в панели управления;
  • добавлена в панель управления NVIDIA новую страницу настройки SLI и PhysX для полного контроля над многопроцессорными графическими конфигурациями;
  • добавлены в панель управления NVIDIA новые функции для полного контроля над CUDA GPU, позволяя пользователю выбрать, как более эффективно использовать GPU для каждого приложения CUDA.

Дополнительная информация:

  • устанавливается HD Audio драйвер версии 1.0.10.1 (для поддерживаемых графических процессоров);
  • поддержка новых GPU-ускоренных функций Adobe CS5;
  • поддержка GPU-ускорения для более плавного онлайн видео в HD качестве с Adobe Flash 10.1;
  • поддержка новой версии видео MotionDSP в программном обеспечении vReveal, которое добавляет поддержку для вывода HD;
  • поддержка DirectCompute на Windows 7 и GeForce 8-серии и старше;
  • поддержка OpenCL 1.0 (Open Computing Language) для всех GeForce 8-серии и старше;
  • поддержка OpenGL 3.3 для GeForce 8-серии и старше;
  • поддержка одного GPU и технологии NVIDIA SLI в DirectX 9, DirectX 10, DirectX 11 и OpenGL, включая 3-Way SLI, Quad SLI и SLI на поддерживающих SLI, сертифицированных материнских платах на базе Intel X58;
  • поддержка разгона GPU и мониторинга температуры при установке программного обеспечения NVIDIA System Tools.

Скачать драйвер для 32-бит и для 64-бит систем Windows 7/Vista вы можете на официальном сайте.

DirectCompute Benchmark версии 0.45

Последнее в этом году обновление бенчмарка DirectCompute/OpenCL.

Новая версия собрана с учетом изменений в финальном релизе AMD Stream SDK 2.0, кроме того сделаны следующие улучшения и исправления:

  • улучшена поддержка систем с несколькими графическими процессорами SLI/Crossfire;
  • программа теперь выдает более детальные сведения об ошибках;
  • за счет отказа от debug версий библиотек повысилась эффективность расчетов на CPU

К сожалению, как отмечает автор, окончательной стабильности работы с видеокартами AMD Radeon 4870x2 добиться так и не удалось. Следующая версия утилиты обещается не раньше января, а загрузить последнюю версию уходящего года можно, как всегда, с официального форума программы (~0,5 МБ).

DirectCompute Benchmark версии 0.44

Небольшое обновление бенчмарка универсальных вычислений.

В новой версии 0.44 улучшена поддержка видеокарт AMD Radeon 4870X2 и добавлена совместимость с новыми драйверами AMD Catalyst версии 9.12. Напоминаем, что программа поддерживает как API Microsoft DirectCompute, входящий в состав DirectX 11, так и платформонезависимый OpenCL.

Загрузить программу можно из форума NGOHQ.com (~0,5 Мб).

NVIDIA отвечает на вопросы о PhysX

В официальных форумах NVIDIA сотрудники корпорации ответили на ряд вопросов пользователей о PhysX.

В ходе компании «Would you like to Ask Nvidia A question?», проводимой в форуме NVIDIA, стали известны мнения некоторых сотрудников NVIDIA о перспективах развития и поддержки технологии NVIDIA PhysX.

Будет ли PhysX конкурентоспособна в мире DirectX 11/OpenCL?

Ответил Том Петерсен, директор по маркетингу технологий: PhysX не конкурирует с OpenCL или входящим в состав DX11 DirectCompute.

PhysX прежде всего интерфейс программирования и среда исполнения для моделирования игровой физики в компьютерных играх. Представьте PhysX как уровень над OpenCL или DirectCompute, которые в свою очередь являются низкоуровневыми интерфейсами для вычислений с помощью графических процессоров. Разработчики игр не создают контент на уровне OpenCL или DirectCompute, они творят, используя наборы инструментов (в том числе и предоставляемые NVIDIA), позволяющие создавать быстро. Как только у них получается качественный контент, они «компилируют» его под конечную платформу (будь то персональный компьютер или игровая приставка) используя другие инструменты.

В этом процессе студии исходят из трёх основных вопросов:

  1. Облегчает ли использование PhysX создание игр для любых платформ, включая консоли?
  2. Позволяет ли PhysX с легкостью включить сногсшибательные эффекты в игру?
  3. Поддержит ли NVIDIA усилия по внедрению данной технологии?

И ответ на все три вопроса следующий: да, да и еще раз — да. Мы тратим наши время и деньги на удовлетворение данных потребностей разработчиков, и в настоящее время сообщество игроделов не требует от нас поддержки OpenCL и DirectCompute.

В конечном итоге, успех PhysX как технологии будет зависеть от того, насколько легко её будет использовать разработчикам и насколько невероятные эффекты можно будет с ней создать. Игра Batman: Arkham Asylum является хорошим примером, каких эффектов можно достичь при использовании PhysX совместно с графическими процессорами NVIDIA, и мы работает над следующим поколением еще более неотразимых игр. В настоящее время NVIDIA не рассматривает возможности по миграции с CUDA на OpenCL или DirectCompute в качестве исполнительного движка для использования ускорения графических процессоров. Мы предпочитаем поддерживать разработчиков во внедрении поразительных спецэффектов.

Будет ли открыт исходный код PhysX?

Ответил Том Петересен: NVIDIA вложила огромные средства и время в PhysX и мы не планируем сегодня делать её общим достоянием. При этом, бинарные модули SDK доступны бесплатно и исходный код может быть лицензирован разработчикам игр, будь у них такая потребность.

Правда ли, что NVIDIA предлагала ATi получить PhysX при условии самостоятельного написания драйвера и осуществления поддержки пользователей? Или ATi правы в утверждениях, что NVIDIA сразу заявила, что никогда не позволит PhysX работать на графических процессорах ATi? Какова официальная позиция NVIDIA по вопросу разрешения ATi бесплатно создать драйвер для работы PhysX на их графических процессорах через OpenCL?

Ответил Джейсон Пол, менеджер продуктов GeForce: Мы открыты для лицензирования PhysX, и уже сделали это для целого ряда платформ, достаточно упомянуть PS3, Xbox, Nintendo Wii и iPhone. Мы желали бы сотрудничать и с AMD, если бы видели такое же желание с их стороны. Мы не можем раздавать технологию PhysX «бесплатно» по тем же причинам, по которым лицензии на Havok или архитектуру x86 не раздаются всем желающим безвозмездно — технология дорого обходится в разработке и поддержке. В целом, мы готовы лицензировать PhysX любой компании, которая сделает нам достаточно серьезное предложение.

DirectCompute Benchmark версии 0.35

Первый бенчмарк для API универсальных вычислений DirectCompute обзавелся поддержкой и OpenCL.

Новая версия 0.35 информационной утилиты и бенчмарка в одном лице DirectCompute Benchmark теперь поддерживает DirectX 10-совместимое оборудование для ускорения DirectCompute, а также может использовать реализации OpenCL для видеокарт AMD и NVIDIA.

Также заметно переработан интерфейс программы. Загрузить последнюю версию утилиты можно с официального сайта.

NVIDIA любит все API, поддерживающие GPU-вычисления

Как известно, Microsoft продвигает DirectCompute для Windows 7, а Apple — OpenCL в Snow Leopard, но NVIDIA верит, что обе компании вдохновлены CUDA.

Иен-Сан Юань во время своего последнего визита в Китай сказал: «Нам нравятся оба эти API, и мы первыми представили компиляторы и драйверы для них. Мы выпустили первый OpenCL-драйвер, первый драйвер с DirectCompute, при этом у нас до сих пор лучший в мире OpenCL-драйвер и мы всё ещё имеем лучший DirectCompute-драйвер, а также лучший в мире CUDA C-компилятор. Причина, по которой мы любим эти API в том, что нам нравятся любые методы программирования GPU».

Он также заметил, что как DirectCompute, так и OpenCL преимущественно сфокусированы лишь на одной операционной системе, тогда как CUDA является куда более открытой платформой.

Также господин Юань подчеркнул преимущества CUDA в качестве стандарта: «Если вам нужны GPU-вычисления для Linux, у нас есть CUDA, если вам нужны GPU-вычисления в будущем для Android, CUDA на сотовых телефонах, или GPU-вычисления на сотовых телефонах, у нас есть CUDA».

Первая утилита для тестирования DirectCompute

Один из участников форума на сайте NGOHQ создал небольшую утилиту, предназначенную для тестирования производительности вычислений общего назначения с помощью стандарта DirectCompute.

Пока DirectCompute Benchmark имеет версию 0.15. К сожалению, утилита поддерживает только оборудование DirectX 11, хотя стандарт DirectCompute позволяет осуществлять расчёты и с помощью DX10-видеокарт. Программа загружает ускоритель огромным количеством расчётов вроде быстрого преобразования Фурье, а также активизирует активный обмен данных с памятью.

Скачать DirectCompute Benchmark можно с сайта NGOHQ.

CyberLink будет использовать DirectCompute в своём ПО

Сейчас компания CyberLink в своих продуктах для кодирования и обработки видео использует технологии NVIDIA CUDA и AMD Stream, но вскоре необходимость поддержки двух различных стандартов может не понадобиться.

На днях AMD и CyberLink сообщили о начале совместной работы над улучшением кодирования видео, автоматического распознавания лиц, маркировки, редактирования видео и обработки видеопотоков с помощью преимуществ нового открытого стандарта вычислений общего назначения средствами видеоускорителей — DirectX 11 DirectCompute.

Благодаря полной открытости DirectCompute, все преимущества от сотрудничества AMD и CyberLink должны получить не только владельцы ускорителей Radeon, но и обладатели GeForce.

AMD: технология PhysX станет бесполезной

Компания AMD не видит проблемы в том, что в системах с видеокартами ATI Radeon отсутствует поддержка PhysX: «В итоге, интерфейс прикладного программирования PhysX просто потеряет свою значимость в будущем».

Нил Робизон, директор отдела по связям с мировыми независимыми разработчиками программного обеспечения, сказал в интервью сайту Icrontic, что Advanced Micro Devices выражает глубокое сожаление по поводу решения NVIDIA отключить поддержку аппаратных расчетов физических эффектов с помощью API PhysX и карт GeForce или Ageia на системах, где визуализацией графики занимаются видеокарты ATI Radeon. Он отметил, что увеличение популярности DirectCompute и OpenCL заставит вскоре запатентованный движок PhysX уйти в забвение.

По словам Нила Робизона, физика необходима игрокам, однако, она должна быть доступной для всех пользователей, потому что только в этом случае разработчики смогут сделать её неотъемлемой частью игрового процесса, а не только дополнительными красивыми эффектами. Для этого нужно создать индустриальный стандарт, вот почему DirectX 11 столь важен для игровой индустрии. DirectCompute позволяет осуществлять расчеты общего назначения на видеокартах различных производителей. Существует несколько физических движков с открытым кодом, которые дают возможность сделать аппаратную физику доступной всем с помощью DirectCompute или OpenCL. Индустриальные стандарты сделают любую закрытую технологию нежизнеспособной.

Господин Робизон также сказал, что между словами и поступками NVIDIA существует большая разница: компания утверждает, что заботится об интересах и выгодах игроков, а при этом отключает через драйвер аппаратные расчеты PhysX на своих же видеокартах в системах, где они выполняют второстепенную роль, а графическим ускорителем выступают видеокарты Radeon.

15 октября NVIDIA выпустит бета-версию Nexus

На технологической конференции, посвященной видеоускорителям, (GPU Technology Conference), которая проходит сейчас в Сан-Хосе, NVIDIA снова показала свою разработку Nexus — первую среду GPU/CPU-разработки, интегрированную в Microsoft Visual Studio.

Nexus поддерживает Windows 7 и Vista и дает возможность разработчикам приложений, использующим вычислительные мощности видеокарт, с помощью средств Microsoft Visual Studio не прибегать к необходимости создавать различные версии программ.

Пакет Nexus включает:

  1. Отладчик кода CUDA C, HLSL и DirectCompute, поддерживающий контрольные точки источника и данных, а также прямой анализ использования памяти видеокарты. Вся отладка исполняется непосредственно на оборудовании.
  2. Инструмент для оценки производительности системы с учетом GPU-событий (ядра, запросы API, передачи по памяти) и CPU-запросов (использования ядер, события передачи запросов и их обработки, а также интервалов ожидания) — всё это отражается на единой взаимосвязанной временной шкале.
  3. Графический инспектор предоставляет разработчикам возможность отладки и профилирования кадров, визуализированы с помощью таких API, как Direct3D. Разработчики смогут использовать этот инструмент для изучения влияния каждой текстуры, вершинных буферов и состояния API в кадре.

NVIDIA планирует выпустить бета-версию Nexus 15 октября. Более подробно с этой средой разработки можно ознакомиться на официальном сайте NVIDIA для разработчиков. Там можно увидеть Nexus в работе, узнать возможности, которые будут включены в бета-версию, а также изучить новую архитектуру CUDA в связи переходом в Fermi на принцип MIMD (Many Instructions Many Data).

NVIDIA: DirectX 11 не увеличит продажи графических карт

На прошедшей конференции с финансовыми аналитиками NVIDIA усиленно убеждала своих партнеров, инвесторов и общественность в том, что новый API DirectX 11, в общем-то, не способен поднять продажи графических карт. А будущее за GPGPU-технологиями вроде DirectX Compute, которая уже поддерживается современными видеоускорителями. Однако, как известно, часто не технологии поднимаю продажи, а маркетинговый отдел.

Майк Хард, вице-президент NVIDIA по связям с инвесторами, на технологической конференции, прошедшей в среду в Deutsche Bank Securities, объяснял партнерам компании, что Microsoft стремится дать разработчикам больше свободы для творчества и новые возможности в DirectX 11, действительно, достигают этой цели, но новый API — не единственная причина, которая способна побудить пользователей к приобретению нового ускорителя.

Он также сделал акцент на том, что пользователи не только играют, но и работают с домашним видео и фотографиями. CUDA уже можно причислить к списку факторов, влияющих на выбор покупателей. Но, думается, дело тут не в реальной полезности технологии, которую пока рядовой пользователь вряд ли может рассматривать серьезно. Маркетологи NVIDIA закрывают глаза на то, что до сих пор на рынке представлены единицы программ, способных задействовать мощности видеокарты. При этом данные программы (Badaboom, MediaShow, LoiLoScope) стоят немалые деньги и могут предоставить лишь ограниченную функциональность, которая не способна удовлетворить нужды большинства людей. Число успешных игр, в которых реализована расширенная поддержка физических эффектов, также невелико, среди них: Batman Arkham Asylum и Mirror’s Age. Одновременно очень богатыми физическими эффектами обладает Red Faction Guerilla, где все расчеты осуществляются процессором.

Нет сомнения, что DirectX 11 — пока тоже остается инструментом маркетинга, ведь большинство современных игр еще очень слабо используют возможности даже DX10, а широкое внедрение новых функций DX11 можно не ждать в ближайшие год—два. Тем более, что игры, написанные на DX11 будут работать быстрее и на современных DX10-видеокартах благодаря внесенным оптимизациям в работу с многоядерными процессорами.

Видеокарты нового поколения от AMD уже через месяц поступят в широкую розничную продажу, что касается NVIDIA, то даже её планы остаются в густом информационном тумане. Безусловно, будь NVIDIA первой, покупателям пришлось бы услышать массу благожелательных слов о DX11 и его очевидной пользе, однако, NVIDIA в настоящее время находится в числе отстающих в технологической гонке и вынуждена призывать потребителей к здравомыслию в отношении новых технологий. Мы тоже присоединяемся к словам маркетологов NVIDIA: сейчас в DirectX 11 практического смысла нет.

Впечатляющая демонстрация возможностей CUDA

Instinct Technology совместно с Dark Water Studios создали демонстрацию DogFighter, призванную наглядно отразить гигантские возможности современных видеоускорителей в области расчетов общего назначения.

Для демонстрации разработан алгоритм параллельных расчетов поведения стаи. В данном случае использовались самолеты, для движения каждого из которых необходимо рассчитать 11 различных характеристик. В демонстрации участвовали 4096 таких самолетов. На вид хаотичное движение полностью рассчитывается только лишь одной видеокартой GeForce с поддержкой технологии CUDA, в результате ни один самолет не столкнулся с другим.

Хотя графика в демонстрации непримечательна, стоит отметить, что в ней используются динамические расчеты освещения и теней, а также эффекты постобработки: туман, глубина резкости, размытие движения, мягкий свет.

Расчеты действий каждого пилота самолета включают рулевое управление и анализ близлежащих объектов для движения к заданной точке без столкновений. У всего роя самолетов также есть общие задачи. К примеру, были поставлены цели собраться вокруг определенной точки, или окружить вращающийся дирижабль, или же заполнить объем параллелепипеда. Для визуализации одного кадра сцены видеокарта производит в общей сложности расчет 16 млн. запросов.

InstinctTech DogFighter CudaDemo

Появление стандартов OpenCL и DirectX Compute открывают перспективы широкого использования расчетов общего назначения на видеокартах. Для сравнения возможностей современных центральных процессоров в области параллельных вычислений, создатели демонстрации запустили ее без использования CUDA. Написанный алгоритм позволяет легко масштабировать задачу и перевести ее выполнение на процессор с другой архитектурой, что показывает преимущество таких технологий как CUDA в задачах подобного рода.

Для сохранения прежней частоты кадров им пришлось ограничить число самолетов до 512. Можно ошибочно предположить, что разница в производительности составляет 8 раз, однако наращивание числа участвующих независимых пилотов увеличивает объем расчетов не в арифметической, а геометрической прогрессии. Так для расчета движения 512 самолетов потребует уже не 16 млн. запросов, а всего лишь 260 тыс. То есть разница в производительности видеокарты и процессора составляет 60 раз.