NVIDIA выпустила новый CUDA Toolkit 3.1
Разработчики, использующие мощности GPU для ускорения приложений, могут скачать и использовать новую версию CUDA Toolkit, которая доступна для Windows, Mac OS и Linux.
Пакет CUDA Toolkit 3.1 включает следующие изменения и дополнения:
- GPUDirect позволяет другим устройствам прямой доступ к памяти CUDA;
- поддержка параллелизма в 16 потоков позволяет использовать одновременно до 16 различных ядер на графических процессорах архитектуры Fermi;
- runtime-драйвер совместимости приложений позволяет универсально использовать драйверы CUDA API с CUDA C Runtime и математическими библиотеками с помощью буфера обмена и миграции;
- добавлены новые возможности языка CUDA C/C++:
- поддержка printf() в коде устройства;
- поддержка функций указателя и рекурсии облегчит портирование многих существующих алгоритмов для Fermi GPU;
- Unified Visual Profiler теперь поддерживает CUDA C/C++ и OpenCL, а так же включает поддержку трассировки CUDA драйверов API;
- математические библиотеки увеличили производительность, в часности:
- улучшенна производительность отдельных трансцендентных функций log, pow, erf, и gamma;
- значительно улучшена производительность для двойной точность FFT при исполнении на архитектуре графических процессоров Fermi для 2^N преобразований;
- потоковый API теперь поддерживается в CUBLAS для перекрытия операций копирования и вычисления;
- оптимизированы CUFFT Real-to-complex (R2C) и complex-to-real (C2R) для 2^N размеров данных;
- улучшена производительность для GEMV и SYMV подпрограмм в CUBLAS;
- оптимизирована реализация вычислений с двойной точностью по принципу разделения и взаимного использования программ для архитектуры Fermi;
- новые и обновленные примеры SDK кода демонстрирует использование:
- функции указателей в ядрах CUDA C/C++;
- буфера обмена OpenCL/Direct3D;
- Hidden Markov Model в OpenCL;
- пример Microsoft Excel GPGPU, показывающий как запускать функции Excel на GPU.
Скачать новую версию CUDA Toolkit вы можете на официальной странице.