Новости про CUDA

15 октября NVIDIA выпустит бета-версию Nexus

На технологической конференции, посвященной видеоускорителям, (GPU Technology Conference), которая проходит сейчас в Сан-Хосе, NVIDIA снова показала свою разработку Nexus — первую среду GPU/CPU-разработки, интегрированную в Microsoft Visual Studio.

Nexus поддерживает Windows 7 и Vista и дает возможность разработчикам приложений, использующим вычислительные мощности видеокарт, с помощью средств Microsoft Visual Studio не прибегать к необходимости создавать различные версии программ.

Пакет Nexus включает:

  1. Отладчик кода CUDA C, HLSL и DirectCompute, поддерживающий контрольные точки источника и данных, а также прямой анализ использования памяти видеокарты. Вся отладка исполняется непосредственно на оборудовании.
  2. Инструмент для оценки производительности системы с учетом GPU-событий (ядра, запросы API, передачи по памяти) и CPU-запросов (использования ядер, события передачи запросов и их обработки, а также интервалов ожидания) — всё это отражается на единой взаимосвязанной временной шкале.
  3. Графический инспектор предоставляет разработчикам возможность отладки и профилирования кадров, визуализированы с помощью таких API, как Direct3D. Разработчики смогут использовать этот инструмент для изучения влияния каждой текстуры, вершинных буферов и состояния API в кадре.

NVIDIA планирует выпустить бета-версию Nexus 15 октября. Более подробно с этой средой разработки можно ознакомиться на официальном сайте NVIDIA для разработчиков. Там можно увидеть Nexus в работе, узнать возможности, которые будут включены в бета-версию, а также изучить новую архитектуру CUDA в связи переходом в Fermi на принцип MIMD (Many Instructions Many Data).

Слухи: движок игровой физики Bullet Physics будет портирован на OpenCL при поддержке AMD

Не смотря на многократные отрицания важности NVIDIA PhysX и GPU физики в целом, AMD возможно всё-таки ступит на территорию аппаратно-ускоряемой игровой физики.

По появившейся в Сети информации, Bullet Physics Library, комплекс библиотек для имитации физических процессов с открытым исходным кодом, при поддержке AMD будет переработан для использования API универсальных вычислений OpenCL. По данным августовского исследования издания Game Developer Magazine, Bullet Physics является третьей по популярности библиотекой физики у разработчиков после принадлежащего NVIDIA PhysX и Havok от Intel. С учетом появившегося вчера на сайте AMD пресс-релиза об отправке своих OpenCL-совместимых решений (включая «фирменные» средства для разработчиков ATI Stream) на сертификацию разработчику OpenCLKronos Group, это может стать серьёзной заявкой AMD на лидерство в области игровой физики.

Любопытно, что ранее разработчики Bullet Physics проявляли интерес к технологии NVIDIA CUDA, и даже выпустили комплект демонстраций с использованием CUDA 2.1 к прошедшей в марте этого года Game Developers Conference`09. От разработчиков Bullet Library пока не поступало официальных подтверждений о сотрудничестве с AMD, как и пояснений о судьбе адаптации для NVIDIA CUDA.

NVIDIA: DirectX 11 не увеличит продажи графических карт

На прошедшей конференции с финансовыми аналитиками NVIDIA усиленно убеждала своих партнеров, инвесторов и общественность в том, что новый API DirectX 11, в общем-то, не способен поднять продажи графических карт. А будущее за GPGPU-технологиями вроде DirectX Compute, которая уже поддерживается современными видеоускорителями. Однако, как известно, часто не технологии поднимаю продажи, а маркетинговый отдел.

Майк Хард, вице-президент NVIDIA по связям с инвесторами, на технологической конференции, прошедшей в среду в Deutsche Bank Securities, объяснял партнерам компании, что Microsoft стремится дать разработчикам больше свободы для творчества и новые возможности в DirectX 11, действительно, достигают этой цели, но новый API — не единственная причина, которая способна побудить пользователей к приобретению нового ускорителя.

Он также сделал акцент на том, что пользователи не только играют, но и работают с домашним видео и фотографиями. CUDA уже можно причислить к списку факторов, влияющих на выбор покупателей. Но, думается, дело тут не в реальной полезности технологии, которую пока рядовой пользователь вряд ли может рассматривать серьезно. Маркетологи NVIDIA закрывают глаза на то, что до сих пор на рынке представлены единицы программ, способных задействовать мощности видеокарты. При этом данные программы (Badaboom, MediaShow, LoiLoScope) стоят немалые деньги и могут предоставить лишь ограниченную функциональность, которая не способна удовлетворить нужды большинства людей. Число успешных игр, в которых реализована расширенная поддержка физических эффектов, также невелико, среди них: Batman Arkham Asylum и Mirror’s Age. Одновременно очень богатыми физическими эффектами обладает Red Faction Guerilla, где все расчеты осуществляются процессором.

Нет сомнения, что DirectX 11 — пока тоже остается инструментом маркетинга, ведь большинство современных игр еще очень слабо используют возможности даже DX10, а широкое внедрение новых функций DX11 можно не ждать в ближайшие год—два. Тем более, что игры, написанные на DX11 будут работать быстрее и на современных DX10-видеокартах благодаря внесенным оптимизациям в работу с многоядерными процессорами.

Видеокарты нового поколения от AMD уже через месяц поступят в широкую розничную продажу, что касается NVIDIA, то даже её планы остаются в густом информационном тумане. Безусловно, будь NVIDIA первой, покупателям пришлось бы услышать массу благожелательных слов о DX11 и его очевидной пользе, однако, NVIDIA в настоящее время находится в числе отстающих в технологической гонке и вынуждена призывать потребителей к здравомыслию в отношении новых технологий. Мы тоже присоединяемся к словам маркетологов NVIDIA: сейчас в DirectX 11 практического смысла нет.

NVIDIA выпустила профессиональную систему для видеомонтажа

В Амстердаме на выставке IBC 2009 компания NVIDIA показала и сообщила о выпуске на рынок системы Quadro Digital Video Pipeline, предназначенной для профессиональной работы в области видеомонтажа, потокового вещания и обработки видео высокого разрешения.

Система состоит из трех основных компонентов: карта видеозахвата Quadro SDI Capture, видеоускоритель Quadro FX и карта видеовывода Quadro SDI Output.

Карта Quadro SDI Capture способна в реальном времени захватывать цифровой видеосигнал во всех стандартных форматах, используемых Обществом кино- и телеинженеров США: 2K, SD, HD, 3G и передавать непосредственно в память видеоускорителя. Возможно получение данных сразу с 4 источников HD-SDI через 75-Ом коаксиальные кабели. Наличие SDI-видеовыхода может быть использовано как для передачи на монитор, так и на карту Quadro SDI Output.

Карта Quadro SDI Output предназначена для видеовещания и позволяет в реальном времени объединить несколько видеосигналов с прозрачной основой в одно изображение. Решение оснащено генлоком, поддерживает 8-, 10- и 12-битный цифровой видеосигнал и позволяет одновременно передавать сигнал на несколько мониторов. С видеоускорителем карта связывается с помощью порта DVI.

Наконец, третий компонент цифрового видеоконвейера — это профессиональный SDI-совместимый графический ускоритель Quadro FX 5800/4800/3800, на который возлагается ответственность за обработку и наложение эффектов на входящий видеосигнал и передачу его на карту видеовывода. Quadro FX 5800 построена на архитектуре GT200, оснащена 240 шейдерными процессорами и 4 Гб памяти GDDR3, обладает поддержкой технологии CUDA для высокотребовательных параллельных расчетов общего назначения, которые, в первую очередь, востребованы в задачах обработки видео.

С помощью Quadro Digital Video Pipeline можно решать следующие задачи:

Объединение нескольких цифровых видеосигналов из различных источников в один.

Захват и перекодирование видеосигнала для вещания в Интернет.

Захват, высококачественная обработка видео в реальном времени, синхронизация и передача результата на средства видеопоказа.

Quadro Digital Video Pipeline уже доступна в продаже через авторизированных партнеров NVIDIA по цене от 5 до 8 тыс. $ в зависимости от используемой графической карты.

CyberLink MediaShow 5 использует CUDA для поиска лиц на фотографиях

Вышла 5-я версия программы MediaShow от CyberLink, которая предназначена для организации архива семейных фотографий и монтажа домашнего видео, и перекодирования его в различные форматы, в том числе создание DVD.

Пользователь сможет в мгновение ока отобрать снимки, где запечатлен тот или иной человек: для этого при добавлении каждого фото в архив он должен лишь проверить, правильно ли программа отметила лица и сопоставила их с уже имеющейся базой данных.

Это очень актуальное решение в свете широкого распространения средств получения цифровых снимков и видеозаписей и увеличения объема пользовательских архивов фотографий до громадного размера.

Использование объединенной мощности центрального процессора и видеокарты GeForce с помощью технологии CUDA позволяет ускорить процесс распознавания лиц на 70 %, отметил Элис Чанг, руководитель CyberLink. Кроме того, MediaShow 5 использует CUDA и для ускорения обработки видео.

Программа vReveal 1.1 для улучшения видео

Компания MotionDSP сообщила о выходе новой версии 1.1 программы vReveal, которая использует мощности видеокарт NVIDIA CUDA для улучшения некачественных видеороликов.

В новой версии внесены следующие изменения:

  • Улучшена стабилизация.
  • Прямая закачка на Facebook.
  • Вывод в DivX.
  • Расширена поддержка видеокарт NVIDIA — теперь vReveal работает с линейкой G80 и выше.

Минимальные требования:

  • ОС: Windows XP или Vista.
  • Процессор: Intel или AMD 1,6 ГГц.
  • Гб оперативной памяти.
  • Не менее 50 Мб свободного места на жестком диске.

Скачать бесплатную версию программы с 30-дневным ограничением можно с официального сайта.

Впечатляющая демонстрация возможностей CUDA

Instinct Technology совместно с Dark Water Studios создали демонстрацию DogFighter, призванную наглядно отразить гигантские возможности современных видеоускорителей в области расчетов общего назначения.

Для демонстрации разработан алгоритм параллельных расчетов поведения стаи. В данном случае использовались самолеты, для движения каждого из которых необходимо рассчитать 11 различных характеристик. В демонстрации участвовали 4096 таких самолетов. На вид хаотичное движение полностью рассчитывается только лишь одной видеокартой GeForce с поддержкой технологии CUDA, в результате ни один самолет не столкнулся с другим.

Хотя графика в демонстрации непримечательна, стоит отметить, что в ней используются динамические расчеты освещения и теней, а также эффекты постобработки: туман, глубина резкости, размытие движения, мягкий свет.

Расчеты действий каждого пилота самолета включают рулевое управление и анализ близлежащих объектов для движения к заданной точке без столкновений. У всего роя самолетов также есть общие задачи. К примеру, были поставлены цели собраться вокруг определенной точки, или окружить вращающийся дирижабль, или же заполнить объем параллелепипеда. Для визуализации одного кадра сцены видеокарта производит в общей сложности расчет 16 млн. запросов.

InstinctTech DogFighter CudaDemo

Появление стандартов OpenCL и DirectX Compute открывают перспективы широкого использования расчетов общего назначения на видеокартах. Для сравнения возможностей современных центральных процессоров в области параллельных вычислений, создатели демонстрации запустили ее без использования CUDA. Написанный алгоритм позволяет легко масштабировать задачу и перевести ее выполнение на процессор с другой архитектурой, что показывает преимущество таких технологий как CUDA в задачах подобного рода.

Для сохранения прежней частоты кадров им пришлось ограничить число самолетов до 512. Можно ошибочно предположить, что разница в производительности составляет 8 раз, однако наращивание числа участвующих независимых пилотов увеличивает объем расчетов не в арифметической, а геометрической прогрессии. Так для расчета движения 512 самолетов потребует уже не 16 млн. запросов, а всего лишь 260 тыс. То есть разница в производительности видеокарты и процессора составляет 60 раз.

NVIDIA обеспечила полную поддержку OpenCL в Snow Leopard

В новой операционной системе Snow Leopard от Apple появилась поддержка межплатформенного стандарта OpenCL для расчетов общего назначения средствами видеокарт.

NVIDIA ввела поддержку OpenCL в среду CUDA и позволила разработчикам использовать для параллельных расчетов как центральный процессор, так и видеоускоритель. Snow Leopard поддерживают следующие видеокарты NVIDIA: GeForce 9400M, GeForce 9600M GT, GeForce 8600M GT, GeForce GT 120, GeForce GT 130, GeForce GTX 285, GeForce 8800 GT, GeForce 8800 GS, NVIDIA Quadro FX 4800 и Quadro FX 5600.

«NVIDIA возглавила рабочую группу OpenCL и является единственной компанией, которая предоставила сегодня тысячам разработчикам Snow Leopard, Windows и Linux драйвер с поддержкой OpenCL, — сказал Сэнфорд Рассел, главный управляющий подразделением CUDA в NVIDIA. — Мы рады видеть приход Snow Leopard, означающий появление GPU-вычислений для всех пользователей Apple».

NVIDIA представила инструменты для OpenCL и обширную документацию, включающую детальное руководство по программированию, примеры лучшего кода с комментариями, а также рекомендации по отладке программ и удобное средство Visual Profiler для быстрой оптимизации производительности и выявления узких мест программного кода.

NVIDIA NEXUS

NVIDIA анонсировала набор инструментов NEXUS для среды разработки Microsoft Visual Studio, призванный облегчить написание и отладку приложений, использующих ресурсы видеокарты.

NEXUS позволит эффективнее разрабатывать приложения, использующие современные API универсальных вычислений, включая CUDAOpenCL и DirectCompute. Не забыты будут и те немногие, которые по старинке пытаются использовать видеокарту для 3D графики :)
Подробности о NEXUS будут представлены на конференции GPU Technology Conference, которая пройдет с 30 сентября по 2 октября, пока же доступно лишь предварительное видео, вкратце демонстрирующее основные функции:

NVIDIA Parallel Nsight: Visual Studio-based GPU Computing and Graphics Development

NVIDIA предсказывает быстрый рост производительности

Глава NVIDIA, Иен-Сан Юань, предсказал, что развитие вычислений общего назначения средствами видеокарт позволит быстро наращивать производительность в ближайшие годы.

Так, по его мнению, GPU-вычисления за шесть ближайших лет позволят увеличить вычислительные способности ПК в сравнении с настоящими в 570 раз, тогда как развитие центральных процессоров за то же время позволит увеличить производительность лишь в 3 раза. Такое сильное увеличение производительности видеокарт в расчетах общего назначения открывает перспективы перехода на визуализацию методом трассировки лучей.

Действительно, высокопараллельные расчеты крайне неэффективно исполняются на современных центральных процессорах. Графические карты, напротив, справляются с такими задачами отлично. С распространением таких языков как CUDA, OpenCL и DirectX Compute, множество вычислительных задач будет значительно ускорено.

Слайды NVIDIA, посвященные Windows 7 и DirectX Compute

В своей внутренней презентации, проведенной для основных клиентов, NVIDIA продемонстрировала несколько интересных слайдов, посвященных технологии DirectX Compute и ОС Windows 7.

На первом слайде отмечается, что благодаря технологии DX Compute некоторые задачи могут быть ускорены в 5—20 раз в сравнении с вычислениями средствами только центрального процессора. Технология поддерживается видеокартами серий GeForce 8, 9, 200 и будущими DX11-решениями.

Второй слайд посвящен приложениям, которые уже реально ускоряют, благодаря мощности видеокарт NVIDIA, задачи декодирования видео, наложение эффектов, кодирование видеопотока, улучшения видео и его редактирование. Среди них есть Cyberlink PowerDirector, MotionDSP vReveal и, конечно, Badaboom.

Третий слайд отмечает, что Windows 7 работает через два процессора: центральный и графический (с поддержкой DirectX Compute).

Четвертый слайд сообщает, что благодаря использованию видеокарты Windows 7 намного лучше справляется с мультимедийными задачами, задачами управления ПК и с игровыми приложениями с PhysX.

Последний слайд сообщает о том, что Windows 7 на 10 % более эффективно использует мощь многочиповых графических конфигураций SLI в сравнении с Windows XP.

NVIDIA CUDA использовалась для реставрации видео высадки на Луну

К 40-летнему юбилею первой высадки американцев на Луне, компания NASA представила миру реставрированные ролики с лунными записями в HD-разрешении (720p).

Как оказалось, специалисты использовали для реставрации профессиональнее графические процессоры NVIDIA Tesla и технологию CUDA.

Скачать доступные ролики или отдельные изображения можно с официального сайта NASA. В видеоролике удалились шумы, мерцания, осветлялись темные края, изображение делалось более резким и повышалось разрешение. На обычном процессоре такая процедура занимала для каждого кадра от 20 до 45 минут, но благодаря NVIDIA Tesla скорость обработки была увеличена в 100 раз. В результате общее время реставрированного видео экспедиции Аполлон 11 займет 2,5 часа.