Новости про GPGPU

NVIDIA выпустила новый CUDA Toolkit 3.1

Разработчики, использующие мощности GPU для ускорения приложений, могут скачать и использовать новую версию CUDA Toolkit, которая доступна для Windows, Mac OS и Linux.

Пакет CUDA Toolkit 3.1 включает следующие изменения и дополнения:

  • GPUDirect позволяет другим устройствам прямой доступ к памяти CUDA;
  • поддержка параллелизма в 16 потоков позволяет использовать одновременно до 16 различных ядер на графических процессорах архитектуры Fermi;
  • runtime-драйвер совместимости приложений позволяет универсально использовать драйверы CUDA API с CUDA C Runtime и математическими библиотеками с помощью буфера обмена и миграции;
  • добавлены новые возможности языка CUDA C/C++:
    • поддержка printf() в коде устройства;
    • поддержка функций указателя и рекурсии облегчит портирование многих существующих алгоритмов для Fermi GPU;
  • Unified Visual Profiler теперь поддерживает CUDA C/C++ и OpenCL, а так же включает поддержку трассировки CUDA драйверов API;
  • математические библиотеки увеличили производительность, в часности:
    • улучшенна производительность отдельных трансцендентных функций log, pow, erf, и gamma;
    • значительно улучшена производительность для двойной точность FFT при исполнении на архитектуре графических процессоров Fermi для 2^N преобразований;
    • потоковый API теперь поддерживается в CUBLAS для перекрытия операций копирования и вычисления;
    • оптимизированы CUFFT Real-to-complex (R2C) и complex-to-real (C2R) для 2^N размеров данных;
    • улучшена производительность для GEMV и SYMV подпрограмм в CUBLAS;
    • оптимизирована реализация вычислений с двойной точностью по принципу разделения и взаимного использования программ для архитектуры Fermi;
  • новые и обновленные примеры SDK кода демонстрирует использование:
    • функции указателей в ядрах CUDA C/C++;
    • буфера обмена OpenCL/Direct3D;
    • Hidden Markov Model в OpenCL;
    • пример Microsoft Excel GPGPU, показывающий как запускать функции Excel на GPU.

Скачать новую версию CUDA Toolkit вы можете на официальной странице.

AMD предлагает инвестировать средства на поддержку разработчиков программ для архитектуры Fusion

AMD имеет большие планы на Fusion и планирует выделять инвестиции, направленные на создание прочной базы разработчиков.

В интервью PC World, директор AMD по продажам Fusion Джон Тейлор объявил о планах AMD по инвестированию в программное обеспечение для разработки приложений, предназначенных для нового поколения процессоров. Тейлор также отметил, что AMD будет вкладывать средства в компании, занимающиеся разработкой оборудования и комплектующих для поддержки архитектуры Fusion.

Тейлор отметил, что целью AMD является ускорение внедрения уникальных решений и вычислительных приложений, специально разработанных для использования комплексной архитектуроы Fusion. Он отметил, что графические процессоры могут, среди прочего, ускорять приложения рендеринга и обеспечивать безопасность браузеров.

Ранее AMD и NVIDIA поддержали усилия по использованию GPU при вычислениях. AMD оказывает помощь разработчикам OpenCL, а NVIDIA оказывает содействие развитию CUDA в течение многих лет.

Тейлор подтвердил, что AMD уже сделала некоторые, связанные с Fusion, стратегические инвестиции, но не раскрыл название компаний, принимающих участие в программе.

Подробнее вы можете прочитать на сайте pcworld.com (на английском).

В III квартале AMD представит пару GPGPU ускорителей для серверов

Компания AMD заявила о выпуске в III квартале 2010 года двух карт FireStream под названиями FireStream 9350 и 9370 соответственно.

FireStream 9370 на основе чипа Cypress GL XT, можно рассматривать как профессиональную версию Radeon HD 5870. Ускоритель содержит 1600 универсальных процессоров, 4 Гб оперативной памяти DDR5 и пиковой производительностью 2.64 TFLOPS и 528 GFLOPS с одинарной и двойной точностью соответственно.

В отличии от предыдущего FireStream 9270, FireStream 9370 имеет пассивный дизайн радиатора, который занимает два слота, имеет два 6pin AUX разъема и максимальное TDP до 225 Вт. В продаже карта появится в третьем квартале, по розничной цене 1999 долл. FireStream 9350, основанный на чипе Cypress GL Pro, содержит 1440 универсальных процессоров, 2 Гб памяти DDR5 и имеет пиковую производительность 2 TFLOPS и 400 GFLOPS с одинарной и двойной точностью соответственно. Также имеет однослотовый пассивной дизайн кулера, два 6pin AUX разъёма с максимальным TDP от 150 Вт. Будет доступен в третьем квартале, по розничной цене 799 долл.

Intel утверждает, что современные видеокарты NVIDIA всего лишь в 14 раз быстрее Core i7-960

Компания Intel на основе внутренних тестов сделала заявление, что её топовые процессоры всего лишь в 14 раз медленнее, чем видеокарты компании NVIDIA . Цель этого - опровергнуть заявления NVIDIA, что её графические процессоры превосходят процессоры Intel до 100 раз. 

В документе под названием "Debunking the 100x GPU vs CPU Myth"  Intel предполагает, что в некоторых случаях NVIDIA GeForce GTX 280 до 14 раз быстрее, чем Intel Core i7-960. Intel утверждает, что в среднем величина преимущества составляет 2,5 раза. Естественно, что NVIDIA тут же опубликовала опровержение этого.

В блоге, пресс-секретарь Andy Keane отметил, что Intel использовала не последнее поколение GPU от NVIDIA, правильнее было сравнивать с видеокартами семейства Fermi. Keane также отмечает, что Intel скорее всего запускала не оптимизированный код на GTX 280, и не понятно, как они сопоставили производительность GPU и центрального процессора.

Cотрудник NVIDIA признал, что не все приложения работают в 100 раз быстрее на GPU, но он привел в пример многих разработчиков, которые добились этого. По крайней мере, семь разработчиков заявили о преимуществе свыше 100 раз, и один заявил о цифре 300 раз.



Окончательные спецификации OpenCL 1.1

Один из лидеров в мире Open Source программирования, Khronos Group сегодня опубликовал спецификации OpenCL 1.1 — первое крупное обновление OpenCL, распространяемое бесплатно.

Версия OpenCL 1.1 добавляет значительные функциональные возможности для расширения возможностей параллельного программирования и привносит в создаваемые приложения больше гибкости, функциональности и производительности, в том числе засчет:

  • новые типы данных, в том числе 3-х компонентные вектора и дополнительные графические форматы;
  • обработка команд из нескольких хостов и использование буфера между несколькими устройствами;
  • операции по отдельным частям буфера в том числе чтение, запись и копирование 1D, 2D или 3D прямоугольных областей;
  • расширенное использование событий и систем управления командами;
  • дополнительные OpenCL C встроенные функции, такие как: integer clamp, shuffle и asynchronous strided copies;
  • улучшенная совместимость с OpenGL на основе эффективного обмена изображениями и буферами для связи OpenCL и OpenGL событий.

Напомню, в рабочую группу OpenCL входят такие известные компании, как: AMD, Apple, Blizzard Activision, Electronic Arts, Ericsson, IBM, Intel, Nokia, S3 Graphics, Sony, STMicroelectronics, Symbian, Texas Instruments и, конечно же, NVIDIA.

Серверные версии процессоров Fusion

AMD планирует внедрить архитектуру Fusion в серверные процессоры.

Вы уже давно в курсе, что будущие процессоры AMD для ноутбуков и персональных компьютеров будут основаны на архитектуре Fusion APU. И вот теперь, на официальном блоге AMD впервые заговорили о планах по внедрению этой архитектуры в будущие серверные процессоры AMD.

Эти планы имеют все шансы на осуществление, поскольку современные суперкомпьютеры уже имеют на борту и центральные CPU и графические GPU процессоры. А с повсеместным внедрением OpenCL и DirectCompute связь между CPU и GPU будет ещё теснее.

Основная проблема стоит в отсутствии оптимизации программной инфраструктуры под архитектуру Fusion, но это должно быть исправлено в новых версиях операционных систем.

Новые программы аттестации и сертификации NVIDIA для CUDA/GPGPU

На этой неделе, на конференции ISC 2010 в городе Гамбурге, Германия, NVIDIA объявила о новых программах для всё более растущего сообщества разработчиков CUDA/GPGPU.

  • CUDA Certification Program. Программа сертификации CUDA разработана в связи с нехваткой квалифицированных инженеров, это первая программа массовой сертификации специалистов, занимающихся параллельным программированием на графических процессорах.
  • CUDA Research Centers. Исследовательские центры CUDA будут проводить аттестацию учреждений, занимающихся вычислениями на GPU в различных областях научных исследований.
  • CUDA Teaching Centers. Обучающие центры CUDA будут охватывать научные учреждения, которые внедрили вычислительные технологии на базе GPU в свою основную программу занятий.

Эти программы дополняют существующую программу CUDA Center of Excellence, которая охватывает на сегодняшний момент 10 научных учреждений во всем мире.

Детали новости можно посмотреть на официальном сайте.

Функции GPU-ускорения в Adobe Photoshop CS5

В официальном блоге NVIDIA был опубликован видеоролик, на котором Син Килбрайд (Sean Killbride), управляющий подразделения технического маркетинга в компании, провёл демонстрацию основных функций в Photoshop CS5, которые получили GPU-ускорение.

Если в Photoshop CS4 были внедрены первые функции, использующие видеокарту для улучшения скорости работы этой программы, то в CS5 их список был значительно расширен.

В CS5 будет улучшена работа с ускорением увеличения, поворота и сдвига рабочей области. В CS5 появилась новая функция, позволяющая быстро увеличивать с помощью видеокарты нужную область изображения. Был улучшен инструмент «пипетка». Теперь при выборе цвета с изображения можно сразу оценить его в специальной области с фоновым. Появилась функция быстрого вызов палитры цветов. Благодаря ускорению GPU в новом Photoshop гораздо удобнее стало выбирать жёсткость кисти и её размер. Также на видео демонстрируется ускоренная сетка пикселей и сетка для инструмента обрезки.

Интересным инструментом нового Photoshop является кисть «Bristle brush», использующая GPU-ускорение. Её поведение максимально приближено к настоящей. Наверняка её преимущества оценят цифровые художники.

Adobe CS5 Accelerated GPU Features

Вышла вторая версия vReveal

Вышло новое обновление до версии 2.0 программы vReveal, которая предназначена для улучшения качества домашнего видео и использует для этого как мощности процессора, так и видеокарты.

В vReveal 2.0 внесен ряд новых фильтров для видео,  также поддержка работы с видеороликами высокой чёткости. Ещё одним важным обновлением новой версии стала появление бесплатного варианта vReveal 2.0, который отличается отсутствием экспорта в HD-формат, не подавляет зернистость на видео, показывает рекламу и добавляет в первые 3 секунды выходного видеоролика водяной знак.

В остальном бесплатная версия идентична vReveal 2.0 Premium. Скачать vReveal 2.0 можно с официального сайта.

Минимальные системные рекомендации:

  • ОС Windows XP, Vista, 7.
  • 2-ядерный процессор.
  • 2 Гб оперативной памяти.
  • 60 Мб свободного пространства на жёстком диске.

Минимальные системные требования для необязательного CUDA-ускорения:

  • Ускоритель NVIDIA GeForce с поддержкой CUDA: серии GeForce 8, 9, 200 и 400.
  • 256 Мб видеопамяти и более для обработки видео 720p и 512 Мб и более — для работы с видео 1080p.
  • Драйвер GeForce 197.13 или более новый.

Gainward начала вместе со своими картами поставлять ПО Super LoiLoScope

Как Zotac и MSI ранее, Gainward приняла решение о комплектации своих карт с поддержкой CUDA редактором видеороликов LoiLoScope от японской компании LoiLo, использующим вычислительные средства видеокарт NVIDIA.

Благодаря партнёрскому соглашению между Gainward и LoiLo, в комплекте с видеокартами серии GeForce GTX 400 будет включена версия Super LoiLoScope с ограничением по времени работы, а также специальная 25-процентная скидка на покупку полноценной версии (LoiLoScope стоит 88 $).

Super LoiLoScope поддерживает NVIDIA CUDA и использует мощности видеокарт практически во всех задачах: от просмотра видео до его редактирования и кодирования. В некоторых задачах прирост по сравнению с расчётами средствами центрального процессора достигает 10-кратной отметки.

Линейка видеокарт Gainward GF100 с LoiLoScope в комплекте должна появиться в европейских магазинах на этой неделе.