Новости про CUDA

Драйверы NVIDIA для видеокарт Quadro 196.75

Вслед за обновлением драйверов для «игровых» карт вышла новая версия драйверов для профессиональной линейки Quadro.

Новые драйверы Quadro 196.75 расширяют поддержку универсальных вычислений, добавляя предварительную поддержку CUDA 3.0, а также поддержку OpenCL для карт Quadro FX x700, FX 4600 и 5600. Прочие изменения включают в себя:

  • поддержка OpenGL 3.2;
  • повышение совместимости с бета-версией Adobe Premiere CS5;
  • исправлена ошибочная инициализация квадробуферизации в Maya 2010;
  • исправлена некорректная отрисовка геометрии с помощью VBO в Catia;
  • повышена скорость выполнения ряда операций с буферами и текстурами;
  • исправлено зависание драйвера в AutoCAD 2010;
  • исправлено падение в «синий экран» при запуске тестов производительности в Maya.

Драйверы имеют сертификат WHQL и доступны для всех текущих версий Windows. Поддерживаются видеокарты Quadro FX и Quadro NVS на архитектурах NV40GL и более новые. Загрузить драйверы можно по ссылкам ниже:

Just Cause 2 будет поддерживать 3D Vision

Еще одна выходящая в этом месяце игра будет поддерживать стереотехнологию.

Менеджер Square Enix по связям с общественностью Mike Oldman дал интервью порталу IGN.com, в котором раскрыл технические детали относительно ПК-версии готовящейся игры Just Cause 2. Прежде всего, список улучшений ПК-версии:

  • поддержка DirectX 10 и 10.1;
  • оптимизация под дву- и четырёхъядерные процессоры;
  • поддержка NVIDIA 3D Vision (игра уже прошла сертификацию!);
  • поддержка многокарточных конфигурация SLI и CrossFire;
  • поддержка многомониторных конфигураций, включая ATI Eyefinity;
  • поддержка геймпада XBox 360;
  • новый спецэффект Bokeh filter для видеокарт NVIDIA, для создания фотореалистичного оптического эффекта;
  • улучшенное формирование поверхности воды для видеокарт NVIDIA;
  • SSAO, мягкие тени, улучшенная система частиц;
  • специальный режим бенчмарка;
  • поддержка возможностей Steam;

Также были подтверждены ранее озвученные системные требования, но не требования для 3D Vision, которые, как мы помним по Metro 2033, обычно заметно выше.

Ниже мы приводим выдержку прочих фактов из интервью:

  • Игра оптимизирована для четырёхъядерных процессоров, два ядра — необходимый для игры минимум.
  • Поддерживаются 64-битные операционные системы Windows, но точного ответа, будет ли native 64-bit executable, не поступило.
  • Игра поддерживает рендеринг одновременно на трёх дисплеях в рамках Eyefinity.
  • Движок использует многие возможности Direct3D 10 и 10.1, включая сглаживание по методу мультисэмплинга, работа с Direct3D 11 поддерживается, но специфические функции не используются.
  • Расширенные настройки качества будут включать мягкие границы теней и объектов, состоящих из частиц, а также три уровня качества SSAO.
  • Движок специально адаптирован для NVIDIA 3D Vision и многокарточных конфигураций SLI/Crossfire, оптимизируя работу при обнаружении данных возможностей.
  • Улучшенное формирование поверхности воды основано на использовании NVIDIA CUDA и заимствовано из реальных симуляторов океана.
  • Прирост производительности от использования SLI/Crossfire в игре достигает 50-70 %.
  • Расширенные устройства управления, вроде джойстиков и мультимедийных клавиатур, в игре поддерживаться не будут. Но, поскольку игра выходит под маркой «Games for Windows», будет полная поддержка контроллера XBox 360, и даже режим автоматического переключения управления с клавиатуры и мыши на геймпад и наоборот, в зависимости от активности устройства.
  • Игра создавалась с расчётом на широкоформатные мониторы, но соотношения и разрешения будут настраиваемыми.
  • Загружаемый контент запланирован и для PC, он станет доступен одновременно с DLC для консольных версий.
  • Пользовательские модификации поддерживаться не будут, как не будет выпущено официального инструмента для их создания.
  • Вся защита от нелегального копирования и использования будет завязана на Steam. Steam будет также основой для многопользовательского режима.

Выход игры ожидается 23 марта в Северной Америке и 26 марта в Европе, для PC, XBox 360 и PlayStation 3 одновременно.

NVIDIA ускоряет работу движка Adobe Mercury Playback

Как мы уже сообщали, новая версия профессиональной программы для монтажа и обработки видео, Premiere Pro от компании Adobe, будет оснащена переработанным движком Mercury Playback Engine.

Этот движок с помощью видеокарт NVIDIA позволяет значительно ускорить скорость рендеринга сцен с наложением множества слоёв, с добавлением эффектов и проч. Также благодаря CUDA и видеокартам NVIDIA Quadro ускоряется и предварительный просмотр результатов монтажа.

Всё это стало возможным благодаря тесной работе разработчиков из Adobe с командой специалистов из NVIDIA во главе с Андрю Креши, который рассказал немного о работе своей команды в небольшом видеоролике.

NVIDIA In A Minute: NVIDIA Fuels Adobe's New Mercury Playback Engine

GPGPU станет возможным прямо в веб-браузере

Из-за спины стандарта трёхмерной графики в Интернет WebGL уже выглядывает…WebCL?

Основанный на OpenGL ES WebGL уже продемонстрировал способность обеспечить новое качество и скорость графики в Интернет, но стандарт может найти и неграфические применения, чему свидетельствуют новые публикации и демонстрации.

В демонстрации приводится пример ускорения операций перемножения матриц путем помещения данных в текстуру и осуществления умножения в шейдере GLSL. Как сообщает автор, умножение матриц 1024x1024 на GPU занимает 5 секунд — заметное ускорение в сравнении с 35 секундами для той же задачи при расчётах на CPU. Для использования демонстрации необходим браузер на основе последней версии Webkit, такой как Apple Safari.

Но не только отдельные энтузиасты изучают потенциал использования графических процессоров веб-приложениями. Для API Jetpack, разрабатываемого в Mozilla Labs для браузера Firefox, изучается возможность ускорения практически любого JavaScript-кода с помощью GPU. Уже существует первая реализация, использующая NVIDIA CUDA, в будущем же вполне вероятно появление некоего общего стандарта для универсальных вычислений через Интернет. Если Khronos Group возьмётся за задачу, мы, возможно, в скором времени увидим новую аббревиатуру: WebCL.

Новые документы CUDA 3.0 по программированию для Fermi

NVIDIA обновила предварительную документацию CUDA 3.0.

В конце прошлого года NVIDIA выпустила бета-версию CUDA SDK 3.0 с предварительной поддержкой Fermi. Однако, большинству CUDA-программистов воспользоваться этой самой предварительной поддержкой оказалось затруднительно — комплектная документация относилась в основном к предыдущей версии CUDA 2.3. И вот теперь на сайте NVIDIA для разработчиков были опубликованы три новых документа, содержащие сведения о архитектуре Fermi, характеристиках Compute Capability 2.0 устройств в целом и программировании на CUDA для них:

Сам CUDA 3.0 SDK и отладочные драйверы можно загрузить с форума NVIDIA для разработчиков.

Симуляция поверхности океана с помощью CUDA

Интересное видео, демонстрирующее возможности современных видеокарт NVIDIA.

GPU OCEAN SIMULATOR

Видео демонстрирует симулятор водной поверхности в реальном времени. Сцена состоит из 2,8 млн. полигонов, расчёты части эффектов производятся с помощью технологии NVIDIA CUDA, финальный рендеринг осуществляется с помощью OpenGL. Для записи ролика симулятор запускался в системе с видеокартой GeForce GTX 280.

Впрочем, воспроизведённая красота океана скрывает за собой обратную сторону GPGPU — разработчик симулятора, компания ALYOTECH, уже несколько лет использует технологии CUDA прежде всего для анализа и визуализации данных радаров систем вооружения и военной техники. Не следует забывать, что графические процессоры в 90-х годах ХХ века пришли на рынок прямиком из военных тренажёров-имитаторов, и теперь просто находят новые применения в военном деле.

Интервью с Дэвидом Кирком о его книге

Доктор Дэвид Кирк, главный учёный NVIDIA, относительно недавно в соавторстве с доктором Вен-мей Хву написал книгу «Programming Massively Parallel Processors: A Hands-on Approach».

Книга посвящена основам и методам программированию на языке CUDA. На специальном видеоролике, выложенном NVIDIA в своём блоге, господин Кирк немного рассказывает о  своей книге. Он говорит, что она создана для начинающих программистов, студентов и профессионалов, желающих понять архитектуру и основные принципы работы GPU.

Также он отмечает, что уже сейчас CUDA преподаётся в 300 университетах и наличие такого пособия является очень важным для преподавания. Также он сказал, что думает о будущих изданиях книги, в которых будут раскрыты особенности программирования с использованием возможностей будущих высокопараллельных графических процессоров.

Подробнее узнать о книге можно на специальном мини-сайте. Купить книгу можно в интернет-магазинах: Elsevier, Amazon или Barnes & Noble.

Interview With Dr. David Kirk on New Parallel Programming Textbook

Причины успеха CUDA от Linux Magazine

Редактор издания «Linux Magazine» Douglas Eadline высказался о причинах успеха технологии NVIDIA CUDA.

Ведущий раздела высокопроизводительных вычислений в своей авторской колонке привёл некоторую статистику NVIDIA по использованию CUDA и её популярности в целом:

  • более 2700 упоминаний CUDA в Google Scholar;
  • более 800 видеоупоминаний CUDA на YouTube;
  • более 670 программ на CUDA Zone;
  • более 350 участников CUDA Superhero Challenge;
  • более 300 университетских курсов по изучению модели параллельного программирования CUDA;

Всё это явно выделяет CUDA среди прочих HPC технологий программирования, включая MPI, OpenMP, OpenCL и будущий Ct от Intel. Douglas Eadline попытался разобраться в причинах такого успеха CUDA.

Средства разработки CUDA бесплатны.

Хотя CUDA и не является open-source, CUDA Toolkit может загрузить и свободно использовать любой желающий с сайта NVIDIA. Даже не требуется регистрация, фактор, который нельзя недооценивать, поскольку традиционно компании-разработчики бесплатных инструментов заставляют проходить сложные регистрации с неизбежной дальнейшей обработкой их пользователей отделами продаж.

CUDA не вносит капитальных изменений в язык C.

Создатели CUDA не стали изобретать новый язык программирования. Любой владеющий C может сходу приступить к изучению и использованию CUDA.

Возможность постепенного перехода на CUDA.

Программист может постепенно добавлять функции CUDA в программу, написанную на C. Не требуется коренной переделки программ для извлечения выгоды из GPU-ускорения.

Низкий порог вхождения.

Обычно нелегко привлечь внимание к новой технологии, когда её использование требует значительных инвестиций в оборудование. В случае CUDA достаточно одной видеокарты на базе NVIDIA для начала работы. Можно проверить эффект на плате начального уровня и лишь потом решать, инвестировать ли в более мощное оборудование.

Поддержка и продвижение CUDA со стороны NVIDIA.

Многие кластерные технологии вроде MPI имеют многие схожие факторы и демонстрируют неплохой рост, но за ними не стоит компании, которая столько вкладывала бы в их продвижение. Для того же MPI просто нет аналогов центра компетенции уровня CUDA Center of Excellence Program.

Успех CUDA должен служить образцом действий для прочих разработчиков HPC технологий. Низкий порог вхождения — ключ к продвижению, а если вы предоставляете свободу разработки, ждать внедрений долго не придётся. К выходу Fermi её уже будут ждать приложения и заказы — многие ли могут похвастаться тем же?

Снова об ускорении обнаружения вирусов

Недавно NVIDIA провела мероприятие CUDA Day, на которое были приглашены многие разработчики, в том числе и Roel Schouwenberg, представлявший Лабораторию Касперского.

Как известно, недавно Лаборатория Касперского оснастила свои серверы, анализирующие новые поступающие вирусы, ускорителями NVIDIA Tesla s1070. Компания утверждает, что ускоритель NVIDIA Tesla s1070 работает в 350 раз быстрее, чем средний 2-ядерный процессор.

Сейчас в Лаборатории Касперского решение, оснащённое ускорением NVIDIA CUDA, анализирует до 50 000 вирусов в день.

Во время мероприятия CUDA Day господин Roel Schouwenberg дал интервью, ознакомиться с которым можно на видео ниже:

ATI Stream SDK 2.01 с улучшенной поддержкой OpenCL

AMD дорабатывает средства GPGPU для разработчиков приложений.

Новая версия 2.01 пакета Stream для неграфического использования GPU AMD содержит изменения «средней тяжести»:

  • ATI Stream Profiler теперь полностью интегрируется в среду Microsoft Visual Studio 2008;
  • поддержка Red Hat® Enterprise Linux версии 5.3;
  • поддержка отладки ядра приложений OpenCL с помощью отладчика GNU в среде Linux;
  • предварительная реализация взаимодействия OpenCL и Direct3D 9/10;
  • четыре новых примера;
  • поддержка отдельно загружаемого средства анализа производительности Stream KernelAnalyzer;
  • исправление множества проблем с компиляцией и исполнением OpenCL;
  • поддержка разработки на Radeon HD 5670 и 5570.

Загрузить пакет ATI Stream можно с сайта AMD для 32- и 64-разрядных версий OpenSUSE, RHEL, Ubuntu, Windows XP, Vista и 7.

Наиболее интересным представляется запрятанная в нёдрах Release Notes улучшенная поддержка ATI CAL, низкоуровневого API для AMD GPU, являющегося эквивалентом CUDA driver-level API у NVIDIA. Теперь можно использовать CAL и OpenCL в одном приложении, и даже запускать OpenCL-программы при неустановленном драйвере Catalyst, что будет востребованным в серверной среде. ATI CAL также позволяет достичь большей производительности с графическими процессорами AMD предыдущих поколений, чья совместимость с OpenCL ограничена.

А вот что не исчезло, так это проблемы с работой OpenCL в системах с установленными реализациями как от AMD, так и от NVIDIA. Разработчикам по-прежнему, как в цирке, приходится перебрасывать из руки в руку библиотеки OpenCL.dll от конкурентов для отладки универсального приложения.