Новости про CUDA Toolkit и GPGPU

Релиз CUDA Toolkit 3.2

Встречайте новую версию CUDA — официально.

После двухмесячного тестирования на кошечках программистах NVIDIA выпустила финальную версию пока что самого успешного GPGPU API CUDA 3.2. Об изменениях в новой версии CUDAуже писалось неоднократно, так что желающие опробовать её в деле могут сразу загрузить всё необходимое с сайта NVIDIA для разработчиков.

Одновременно вышли и новые отладочные драйверы видеокарт для разработчиков, традиционно, более новой версии, чем драйверы для конечных пользователей. Загрузить новые драйверы для основных платформ можно по ссылкам ниже:

CUDA Toolkit 3.2

Предварительная версия для разработчиков.

NVIDIA анонсировала следующую версию средств для разработки CUDA Toolkit для API CUDA. В новой версии 3.2, как сообщается, разработчиков ожидают следующие новшества:

  • Новые библиотеки CUSPARSE (для операций с матрицами) и CURAND (генератор случайных чисел).
  • Улучшение производительности библиотек CUFFT и CUBLAS на архитектуре Fermi.
  • В состав CUDA Toolkit теперь включены библиотеки для работы с видео в формате H.264.
  • Добавлена поддержка новых продуктов Quadro и Tesla с объёмом буфера более 4 Гб, включая отладку на таких конфигурациях.
  • Отладка многопроцессорных конфигураций в cuda-gdb и Parallel Nsight.
  • Поддержка Fermi в cuda-memcheck.
  • Поддержка компилятора Intel C в 64-битных версиях Linux в NVCC.
  • Поддержка функций malloc() и free() в ядре CUDA-программы.
  • nvidia-smi поддерживает выдачу нескольких новых счётчиков производительности, включая загрузку GPU.

Доступ к предварительной версии CUDA Toolkit 3.2 осуществляется через бесплатную регистрацию на сайте NVIDIA для разработчиков.

NVIDIA выпустила новый CUDA Toolkit 3.1

Разработчики, использующие мощности GPU для ускорения приложений, могут скачать и использовать новую версию CUDA Toolkit, которая доступна для Windows, Mac OS и Linux.

Пакет CUDA Toolkit 3.1 включает следующие изменения и дополнения:

  • GPUDirect позволяет другим устройствам прямой доступ к памяти CUDA;
  • поддержка параллелизма в 16 потоков позволяет использовать одновременно до 16 различных ядер на графических процессорах архитектуры Fermi;
  • runtime-драйвер совместимости приложений позволяет универсально использовать драйверы CUDA API с CUDA C Runtime и математическими библиотеками с помощью буфера обмена и миграции;
  • добавлены новые возможности языка CUDA C/C++:
    • поддержка printf() в коде устройства;
    • поддержка функций указателя и рекурсии облегчит портирование многих существующих алгоритмов для Fermi GPU;
  • Unified Visual Profiler теперь поддерживает CUDA C/C++ и OpenCL, а так же включает поддержку трассировки CUDA драйверов API;
  • математические библиотеки увеличили производительность, в часности:
    • улучшенна производительность отдельных трансцендентных функций log, pow, erf, и gamma;
    • значительно улучшена производительность для двойной точность FFT при исполнении на архитектуре графических процессоров Fermi для 2^N преобразований;
    • потоковый API теперь поддерживается в CUBLAS для перекрытия операций копирования и вычисления;
    • оптимизированы CUFFT Real-to-complex (R2C) и complex-to-real (C2R) для 2^N размеров данных;
    • улучшена производительность для GEMV и SYMV подпрограмм в CUBLAS;
    • оптимизирована реализация вычислений с двойной точностью по принципу разделения и взаимного использования программ для архитектуры Fermi;
  • новые и обновленные примеры SDK кода демонстрирует использование:
    • функции указателей в ядрах CUDA C/C++;
    • буфера обмена OpenCL/Direct3D;
    • Hidden Markov Model в OpenCL;
    • пример Microsoft Excel GPGPU, показывающий как запускать функции Excel на GPU.

Скачать новую версию CUDA Toolkit вы можете на официальной странице.