Новости по теме «Infosys и NVIDIA открыли технологический центр CUDA в Индии»

NVIDIA представила профессиональную карту на базе Turing

Сегодня компания NVIDIA представила первую видеокарту новой архитектуры Turing. Её процессор оснащён специальными ядрами «RT Core» для трассировки лучей, сложной техники, дающей предельно фотореалистичную картинку. Благодаря им эти расчёты теперь могут выполняться в реальном времени.

В компании отметили, что представленная видеокарта Quadro RTX стала «первым GPU для трассировки лучей» и одновременно является крупнейшим прорывом для компании с 2006 года, когда была представлена технология CUDA.

Дзень Хсунь Хуан представляет видеокарту Quadro RTX 8000

Даже по названию очевидно, что это будет карта для профессиональной работы. Ускоритель Quadro RTX 8000 будет стоить 10 000 долларов, когда он будет доступен к концу года. Плата будет содержать целых 48 ГБ видеопамяти GDDR6. Её графический процессор получит 4608 ядер CUDA и 576 тензорных ядер. Скорость трассировки лучей названа NVIDIA на уровне 10 гигамассивов в секунду, а общая производительность составит 16 терафлопс. Графический процессор получит интерфейс NVLink, а значит NVIDIA предполагает масштабирование видеокарт. Также из интерфейсов стоит отметить наличие порта VirtualLink, предназначенного для будущих устройств виртуальной реальности.

Анонс видеокарты состоялся в ходе SIGGRAPH, конференции для профессионалов в области компьютерной графики. На следующей неделе ожидается анонс игровых видеокарт на базе GPU Turing. Что это будут за ускорители, по-прежнему остаётся загадкой.

NVIDIA выпускает CUDA 9

Компания NVIDIA отметила новый этап в индустрии HPC и AI, анонсировав финальную спецификацию CUDA 9.

Предрелизная спецификация CUDA 9 была выпущена достаточно давно, но только теперь появилась финальная версия.

Кроме поддержки новой архитектуры и оптимизации библиотек, совсем скоро появятся совершенно новые приложения. Главные изменения в CUDA 9 включают:

  • Ускорение высокопроизводительный вычислений (HPC) и в приложениях глубокого анализа с новыми ядрами GEMM в cuBLAS.
  • Более быстрое исполнение приложений обработки изображений и сигналов на нескольких GPU в cuFFT и NVIDIA Performance Primitives.
  • Решение линейных и графических аналитических проблем, общих для HPC, с новыми алгоритмами в cuSOLVER и nvGRAPH.
  • Ускоренные распараллеленные алгоритмы с потоками из подэлементов в кривых, блоках и сетках.
  • Управление  и эффективное повторное использование потоков внутри приложений с новым API и функциональными примитивами.
  • Оптимизация и предварительная подготовка доступа к памяти по идентификации исходного кода, приводящего к ошибкам на странице унифицированной памяти.
  • Унифицирована производительность в узких местах памяти с новыми фильтрами, основанными на виртуальных адресах, причинах миграции и типах ошибок адресации страниц.

Также компания добавила ряд изменений для поддержки архитектуры Volta и технологии NVLink.

Otoy реверсно разработал NVIDIA CUDA для не-NVIDIA устройств

Разработчик Otoy анонсировал программное обеспечение OctaneRender, которое позволяет запускать NVIDIA CUDA приложения на аппаратном обеспечении отличном от NVIDIA.

Компания отмечает, что CUDA является превосходной альтернативой OpenCL и позволяет создавать намного более богатое графическое ПО. Именно поэтому Otoy и решила разработать CUDA методом реверс инжиниринга, и создала единый CUDA код, который можно запускать на GPU не только от NVIDIA, но и разработки AMD, ARM и Intel.

Основной целью разработки является предоставление CUDA приложений, таких как Octane, для Apple Metal GPGPU API под OSX и iOS, где заметно не хватает OpenCL 2.1, Vulkan и OpenGL ES.

Разработчики отметили, что они мечтали сделать превосходные CUDA программы доступными для разработчиков игр на таких устройствах как компьютеры Mac и iOS. В Otoy адаптировали Octane для работы в качестве плагина для игрового движка, как движок Epic Unreal.

Новая функция появится вместе с релизом Otoy Octane 3.1. Подробную информацию можно найти на сайте VentureBeat.

Обновилась популярная информационная утилита GPU-Z до версии 0.8.7

Сайт TechPowerUp подготовил очередное обновление своей популярной утилиты GPU-Z, предназначенной для получения всей доступной информации о вашей видеокарте и мониторинга её параметров. Обновление получило номер 0.8.7.

Версия 0.8.7 утилиты в основном характеризуется различными исправлениями ранних ошибок, в числе которых неверное определение устройств, устранение зависаний, детекция поддержки различных технологий и их версии. Также база данных видеокарты расширилась целым рядом графических ускорителей NVIDIA, AMD и Intel.

Полный перечень изменений приведён ниже:

  • Теперь правильно определяется версия драйвера Radeon Software Crimson Edition.
  • Исправлено чтение напряжения GPU 1,55 В на процессорах AMD Fiji.
  • Исправлен на верный 12_1 уровень возможностей DirectX на iGPU Skylake.
  • Исправлен синий экран на Intel Cloverview (Atom Z2760).
  • Исправлено определение CUDA для устройств с номером шины большем 9.
  • Исправлено наименование AMD Beema.
  • Улучшено объяснение определения ошибок OpenCL на GPU AMD.
  • Некоторые карты HD 2000 и HD 3000 теперь корректно определяются как ATI.
  • Версия ID теперь всегда отображается двумя цифрами.
  • Исправлено отображение шейдерной модели на старых картах.
  • Исправлена миллисекундная точность во временных отметках файла журнала.
  • Обновлён перевод американского английского.
  • Прочие исправления стабильности.
  • Добавлена поддержка NVIDIA GTX 980M 8GB, GTX 965M, GTX 750 (GM206), GT 710 (GK208), Quadro K1200, M5000, M2000M, M1000M, K2200M, GRID K160Q, Tesla K80.
  • Добавлена поддержка AMD R9 380X, R7 350, Mullins.
  • Добавлена поддержка Intel Skylake Graphics 510, P530, 540.

Загрузить бесплатную утилиту GPU-Z можно с нашего сайта.

NVIDIA выпускает два драйвера и намекает на использование GPU Pascal и Volta

Недавно компания NVIDIA выпустила драйвер GeForce 358.66, в котором выявлены некоторые интересные особенности.

Интересным же этот драйвер делает то, что кроме стандартного набора поддержки GPU и утилит, в нём содержится информация о графических процессорах Pascal и Volta. Также примечательной является предварительная поддержка API Vulkan, наследника OpenGL.

При изучении раздела OpenCL драйвера GeForce 358.66, были выявлены две новые возможности вычислений посредством новой архитектуры CUDA. Обнаружены записи «D__CUDA_ARCH__=600» (а также «610» и «620») для GPU Pascal и «-D__CUDA_ARCH__=700» для GPU Volta. Ранее компания использовала ID «-D__CUDA_ARCH__=500» для Maxwell, «D__CUDA_ARCH__=300» для Kepler и «-D__CUDA_ARCH__=210» для графики семейства Fermi.

Ожидается, что видеоплаты с GPU Pascal будут представлены в первой половине 2016 года, и новый драйвер даёт намёк на новые и различные вычислительные возможности будущих GPU.

Примечательно, что практически сразу за ним NVIDIA выпустила драйвер GeForce 358.87 WHQL, который получил поддержку Call of Duty: Blacks OPS III, Anno 2205, а также пакет улучшений GameWorks для War Thunder. Кроме этого драйвер получил новые SLI профили и улучшенную поддержку виртуальной реальности.

Компания NVIDIA пообещала, что до конца года будет выпускать обновления драйверов непосредственно перед выпуском игр из следующего списка: Assassin’s Creed Syndicate, Call of Duty: Black Ops III, Civilization Online, Fallout 4, Just Cause 3, Monster Hunter Online, Overwatch, RollerCoaster Tycoon World, StarCraft II: Legacy of the Void, Star Wars: Battlefront, Tom Clancy’s Rainbow Six Siege, War Thunder.

Компания Finalwire обновила AIDA64 до версии 5.20

Компания FinalWire Ltd. анонсировала новую версию за номером 5.20 популярной диагностической и тестовой утилиты AIDA64.

В новой версии набора утилит появилась поддержка новых LCD устройств, внесены изменения в панель датчиков, добавлена поддержка новых процессоров Intel и AMD, а также видеокарт NVIDIA GeForce GTX 960 и GeForce GTX Titan X. Кроме того, были оптимизированы встроенные в AIDA64 бенчмарки.

Полный перечень изменений приведён ниже:

  • Оптимизирован 64-битный бенчмарк для APU Carrizo.
  • Добавлены бенчмарки с AVX2 и FMA ускорением для процессоров Broadwell.
  • Улучшена поддержка процессоров Intel Braswell, Broadwell-H, Cherry Trail и Skylake.
  • Добавлена предварительная поддержка APU AMD Nolan.
  • Добавлена поддержка датчиков жидкостных систем охлаждения AquaStream XT, MPS, PowerAdjust 2, PowerAdjust 3.
  • Добавлена поддержка датчиков блока питания Thermaltake DPS-G.
  • В панели датчиков появились столбчатые диаграммы (слева направо), управление статичными метками, измерение температуры с точностью 0,01 °С для желаемых датчиков.
  • Добавлена поддержка экранов Odospace LCD.
  • Добавлена поддержка CUDA 7.0, OpenCL 2.1.
  • Добавлена поддержка SSD Neutron XT, Crucial BX100, Crucial MX200, SanDisk Ultra II.
  • Добавлены детальные сведения о графических картах NVIDIA GeForce GTX 960, GeForce GTX Titan X.

AIDA64 v5.20, доступна в трёх редакциях: Extreme и Business, а также Extreme Engineer для инженеров с разрешением использовать на неограниченном количестве ПК, приобрести которые можно в онлайн-магазине AIDA64.

Компания Finalwire обновила AIDA64 до версии 4.70

Компания FinalWire Ltd. анонсировала новую версию за номером 4.70 популярной диагностической и тестовой утилиты AIDA64.

В новой версии набора утилит появилась поддержка массы LCD и VFD устройств, новых процессоров и стандартов видеоускорения, расширена база данных оборудования, однако главным изменением стала поддержка операционной системы Windows 10.

Полный перечень изменений приведён ниже:

  • Поддержка новых LCD и VFD устройств: Acer Idea 500, Adafruit, Aquaero, AX206, BWCT, CH424, Crystalfontz, ct-Mausekino, Cwlinux, Dangerous Prototypes HD44780, Futaba DM-140GINK, Futaba MDM166A, GLCD2USB, IkaLogic, LCDInfo USB13700, LCDInfo USBD480, LPT, Matrix Orbital LK RS232, Matrix Orbital GLK RS232, Odroid-Show, Phidget, picoLCD, POS, Pyramid, Roccat Valo, Samsung SPF, SoundGraph iMon LCD, SpikenzieLabs MPTH, Sure Electronics, Trefon, USB2LCD+, Wallbraun LUI, Yoctopuce.
  • Поддержка Microsoft Windows 10 Technical Preview и Windows Server 2015 Technical Preview.
  • Улучшена поддержка Razer SwitchBlade UI LCD.
  • Поддержка материнских плат LGA2011-v3.
  • Поддержка CUDA 6.5, OpenGL 4.5.
  • Добавлены SSD AData SP610, AData SP910, Corsair Force LX, Corsair Neutron, Corsair Neutron GTX, OCZ Arc 100, Seagate 600, SanDisk Extreme Pro, SanDisk X300.
  • Появились детали для AMD Radeon R9 285.
  • Появились детали для GeForce 900 Series.

AIDA64 v4.60, доступна в трёх редакциях: Extreme и Business, а также Extreme Engineer для инженеров с разрешением использовать на неограниченном количестве ПК, приобрести которые можно в онлайн-магазине AIDA64

Компания Finalwire обновила AIDA64 до версии 4.30

Два дня назад компания FinalWire Ltd. анонсировала новую мартовскую версию за номером 4.30 популярной диагностической и тестовой утилиты AIDA64.

Новая версия утилиты получила дальнейшее расширение многопоточных бенчмарков и возможности стресс-тестирования, которые теперь покрывают 128 логических процессоров и 2 группы процессоров, улучшена поддержка Microsoft Windows 8.1 и Windows Server 2012 R2, а также добавлены самые новые GPGPU технологии.

Полный перечень изменений приведен в списке ниже:

  • поддержка Microsoft Windows 8.1 Update 1 и Windows Server 2012 R2 Update 1;
  • OpenCL GPGPU бенчмарк хэша SHA-1;
  • поддержка CUDA 6.0;
  • поддержка материнских плат AM1;
  • улучшена поддержка Intel Broadwell;
  • добавлена предварительная поддержка APU AMD Carrizo и Toronto;
  • добавлена предварительная поддержка CPU Intel Skylake, Cherry Trail и Denverton;
  • добавлена поддержка SSD Crucial M550 и Intel 730;
  • уточнена информация о AMD Radeon R7 265;
  • уточнена информация о NVIDIA GeForce GTX 745 и серии GeForce 800.

AIDA64 v4.30, доступна в трёх редакциях: Extreme и Business, а также Extreme Engineer для инженеров с разрешением использовать на неограниченном количестве ПК, приобрести которые можно в онлайн-магазине AIDA64.

Рой Тейлор: CUDA и PhysX обречены

Рой Тейлор, бывший вице-президент NVIDIA по контенту, а ныне глава мировых продаж AMD, дал интервью сайту VR Zone, в котором рассказал об APU, видеоиграх и будущем технологий NVIDIA CUDA и PhysX.

По словам Тейлора, рост APU действительно очень хорош, он отмечает, что эти чипы начали вытеснять с рынка дискретные карты низкого уровня, и даже, иногда, карты мейнстрим сегмента. При этом он не нашёл добрых слов о будущем проприетарных технологий NVIDIA CUDA и PhysX, главой разработки которых он в прошлом являлся. Сам директор убеждён, что CUDA обречена, поскольку промышленность не любит закрытых стандартов. Технологию PhysX Рой также считает ошибкой NVIDIA, но не саму технологию, а то, что она остаётся проприетарной. При этом, сама NVIDIA всегда утверждает, что не делает из своего физического движка секрета и приглашает всех производителей аппаратного обеспечения (включая AMD) присоединиться к этой технологии.

«Я думаю, что CUDA обречена. Наша промышленность не любит проприетарных стандартов. PhysX это также ошибка, потому что она проприетарна. Никто не хочет её. Вы не хотите её, я не хочу её, геймеры не хотят её. Аналитики не хотят её. На заре нашей промышленности вы могли стоять в стороне, и всё бы работало. Мы все прошли через это. Но с ними не всё в порядке. NVIDIA должна быть отблагодарена за своё изобретение. Это тенденция, GPGPU совершенно фантастичны и сказочны. Но что затем, что сейчас. Сейчас вся наша индустрия не хочет проприетарных стандартов. И именно поэтому люди переходят на OpenCL».

NVDIA обещает 10% прирост производительности CUDA благодаря LLVM

Разработчик микропроцессоров, компания NVIDIA, обновила CUDA библиотеку базовых классов для объектно-ориентированного GPGPU программирования, включив в неё для увеличения производительности низкоуровневую виртуальную машину — low level virtual machine (LLVM).

В прошлом году компания объявила о значительных изменениях в их проприетарном программном фреймворке CUDA, а несколько дней назад выпустила первую версию изменения, которое включает компилятор LLVM. По утверждению NVIDIA, LLVM обеспечит «постоянное 10% ускорение в производительности приложений».

Кроме того, что NVIDIA теперь восхваляет мощь LLVM компилятора, фирма также предлагает виртуальный профилировщик, который поможет программистам оптимизировать их код. Суть в том, что программирование для GPGPU в большинстве случаев требует значительных оптимизаций, чтобы выжать каждую последнюю каплю скорости из GPU.

Кроме LLVM компания расширила библиотеку обработки сигналов. Обычно самостоятельный цифровой сигнальный процессор используется исследователями для симуляции определённых нагрузок, но с растущей библиотекой обработки сигналов некоторые нагрузки могут быть запущены на графической платформе NVIDIA с включённым CUDA.

Но пока NVIDIA наслаждалась популярностью CUDA в исследовательском сообществе, на горизонте появился серьёзный конкурент в лице OpenCL — открытого языка GPGPU вычислений. Тем не менее, NVIDIA утверждает, что им абсолютно безразлично какой именно язык используют программисты, до тех пор, пока они используют их графические платформы, продвигая CUDA в качестве отличного способа улучшения продаж GPU продуктов компании.

Книга «Технология CUDA в примерах» стала доступна на русском языке

На русский язык переведена книга Джейсона Сандерса и Эдварда Кэндрота «Технология CUDA в примерах: введение в программирование графических процессоров» с предисловием Джека Донгарра.

Книга написана двумя старшими членами команды по разработке программной платформы CUDА. Новая технология представлена в ней с точки зрения программиста. Авторы рассматривают все аспекты разработки на CUDA, иллюстрируя изложение работающими примерами. После краткого введения в саму платформу и архитектуру CUDA, а также беглого обзора языка CUDA С, начинается подробное обсуждение различных функциональных возможностей CUDA и связанных с ними компромиссов. Вы узнаете, когда следует использовать то или иное средство и как писать программы, демонстрирующую поистине выдающуюся производительность.

Издание предназначено для программистов, а также будет полезно инженерам, научным работникам и студентам вузов.

Уже в продаже.

NVIDIA выпустили новую версию PhysX 3.0

Сегодня компания NVIDIA представила новую версию физического движка PhysX, который уже доступен для зарегистрированных пользователей.

По заявлению NVIDIA, PhysX был переписан полностью. Это было необходимо для повышения производительности поддержки большого количества игровых устройств. Выход PhysX для планшетов и смартфонов также не может сильно удивить пользователей. Ведь это было объявлено еще во время анонса PhysX SDK 3.0, к тому же NVIDIA уделяет этому рынку очень большое внимание.

В NVIDIA заверяют, что PhysX 3.0 предоставляет разработчикам поддержку лучшую поддержку игр, потоков данных, более эффективную мультипоточность и средства улучшенной поддержки визуализации.

Для бесплатной загрузки доступны пакеты PhysX 3.0 для PC, Xbox 360, PS3, Mac OS X, Linux и Android. Ну и конечно, для работы среды необходим CUDA-совместимый графический процессор NVIDIA.

Бета-драйверы NVIDIA 260.19.26 для Linux и драйвер CUDA 3.2 для MacOS

Обновление драйверов для альтернативных операционных систем.

NVIDIA опубликовала следующую предварительную версию драйверов для Linux за номером 260.19.26. Об изменениях не сообщается, все желающие могут их поискать, скачав дистрибутив с FTP сайта по ссылкам ниже. Поддерживаются видеокарты GeForce/Quadro на базе NV40 и более новых архитектур.

Также обновился драйвер CUDA для видеокарт NVIDIA в компьютерах Apple Mac. Версия 3.2.17 поддерживает, как следует из названия, последнюю версию CUDA API, а также новые видеокарты Quadro 4000 for Mac. Загрузить драйвер для MacOS X 10.6.5 можно с сайта NVIDIA (~15 Мб).

NVIDIA официально представила самое мощное DirectX 11 решение — GeForce GTX 580

Видеокарта выполнена по 40 нм техпроцессу и на текущий момент является самой мощной одночиповой видеокартой с поддержкой DirectX 11.

Сердцем карты выступает чип GF110:

  • 512 ядер CUDA;
  • 64 TMU.

Остальные характеристики таковы:

  • 384-разрядная шина памяти;
  • 1536 Мбайт GDDR5 видеопамяти;
  • тактовая частота GPU — 772 МГц;
  • частота шейдерного массива — 1544 МГц;
  • эффективная частота памяти — 4008 МГц;
  • шина PCI-Express 2.0;
  • TDP карты составляет 244 Вт;
  • видеовыходы представлены парой DVI и одним mini-HDMI;
  • поддерживаемые технологии: SLI, CUDA, PhysX и 3D Vision Surround;
  • поддерживаемые API: DirectX 11, OpenGL 4.1.

NVIDIA официально заявляет о 30% приросте производительности по сравнению с оригинальной GeForce GTX 480. А прирост производительности в «старых» играх с использованием DX9 и DX10 достигает 62 процентов. Среди таких старых игр значится, кстати, и StarCraft II. Разумеется, не обошли вниманием и предстоящий хит в лице Crysis 2 — по заявлению Cevat Yerli, президента и CEO компании Crytek, для спасения Нью-Йорка суперсолдату недостаточно будет наносьюта, потребуются также лучшие из имеющихся технологий, то есть именно те, которые предоставляет GeForce GTX 580!

Рекомендованная стоимость карты GeForce GTX 580 для России 17 999 рублей, хотя партнеры компании не стесняются запрашивать за свои изделия и 590 долларов! В розничной торговле появление карт ожидается после 20 ноября.

Среди официальных партнеров NVIDIA по выпуску GTX 580 значатся такие компании, как: ASL, ASUS, Colorful, ECS, EVGA, Gainward, Galaxy, Gigabyte, Innovision 3D, Jetway, Leadtek, MSI, Palit, Point of View, PNY, Sparkle, Zotac и другие.

Фактически, мы просто наконец-то получили ту самую Fermi, которую ждали еще весной. GF110 честнее было бы назвать GF100b, поскольку никаких отличий от источника в спецификациях не замечено, даже не добавлена ожидавшаяся поддержка передачи звука DTS-HD и Dolby TrueHD 7.1 через HDMI, появившаяся в GF104. Разъём DisplayPort по-прежнему отсутствует в референсном дизайне, хотя уже несколько поколений как стал стандартом для видеокарт Quadro. Настоящим событием является новая система охлаждения, которая обещает приемлемый уровень шума при охлаждении «топовой» видеокарты. Спуск этой системы в средний сегмент позволит создать по-настоящему малошумные видеокарты — если только цена решения не будет превышать стоимость остальной видеокарты.

А пока поприветствуем одночипового чемпиона этого года — во всяком случае до выхода решений следующего поколения, от AMD или NVIDIA.

Endless City — новое демо от NVIDIA

Работает только на GeForce 400-й серии.

Появилась информация о новой технологической демонстрации NVIDIA под названием Endless City. В демонстрации показан большой город, создаваемый прямо по ходу демонстрации с помощью процедурной генерации под названием L-system, использующей CUDA. К созданной сцене применяется тесселляция для дополнительной детализации и полностью динамическое освещение. Как сообщает сопроводительная документация, число отображаемых полигонов может достигать 600 млн/с, при сотнях тысяч источников освещения. В демонстрации используется SSAO, а также обеспечена совместимость с 3D Vision.

endlesscitynvidia.wmv

Загрузить демонстрацию можно с сайта NVIDIA (~255 Мб). Системные требования включают в себя Windows Vista/7 и видеокарту с поддержкой CUDA и DirectX 11 (т. е. на картах на базе AMD работать не будет). На видеокартах GeForce GTX 480 демонстрация выдаёт порядка 30 FPS, на GTX 460 — 15 FPS.

Отсутствие демонстрации в соответствующем разделе сайта NVIDIA означает, скорее всего, что официальный запуск будет приурочен к анонсу GeForce GTX 580.

Глава NVIDIA поделился видением будущего GPGPU-технологий

CUDA останется основным API, поддерживаемым NVIDIA.

Глава NVIDIA Jen-Hsun Huang в интервью британскому отделению издания ZDNet ответил на вопросы о будущем GPGPU-технологий. Мы приводим выдержку высказанных им суждений:

  • NVIDIA активно поддерживает открытый стандарт OpenCL, тем более что Khronos Group в настоящее время возглавляет сотрудник компании. NVIDIA первой реализовала поддержку OpenCL, причём она всё еще считается лучшей в отрасли, и будет поддерживать OpenCL и дальше.
  • Технологии меняются очень быстро, производительность увеличивается четырёхкратно каждые два года, новые функции внедряются постоянно. В силу этого NVIDIA концентрируется на CUDA, не желая немедленно «выкатывать» новый общий стандарт. Тем более, что OpenCL такого внимания и не требует — там есть множество людей, в том числе из IBM, AMD, Intel, и NVIDIA не нужно тащить всё в одиночку.
  • CUDA получил большее распространение, чем OpenCL, в силу большей истории и инвестиций в разработку, большего числа работающих с ним людей, большего качества инструментов разработки, компилятора, надёжности рабочей среды.
  • NVIDIA не пытается каким-то способом полностью заменить CPU или нарушить их работу. Операционные системы и офисные приложения будут продолжать работать на CPU — но будет возможно прибегнуть к силе GPU для того, чтобы «проломить» определённые задачи.
  • Будущее за гетерогенной средой, в которой встретятся нарастившие мощь векторной обработки данных CPU и GPU с параллельной обработкой данных, научившиеся решать более сложные типы задач. В такой среде все приложения будут работать невероятно быстро.
  • Сейчас ситуация с приложениями такая, что они не работают, не работают, а потом раз — и работают очень быстро. Технологии вроде виртуальной памяти и синхронизации данных в памяти облегчат программирование. В целом будет лучше, если приложения будут работать сразу, пусть и лишь в три раза быстрее. Затем можно будет заниматься оптимизацией.
  • Сейчас графические процессоры лучше всего работают с одним приложением, так устроен их конвейер, следствие stateful-подхода. К примеру, одна большая программа исполняется на многих GPU. В будущем будет иная ситуация: множество приложений, использующих один GPU. NVIDIA работает над тем, чтобы обеспечить возможность использования обоих подходов.
  • В будущей архитектуре сервер с одним модулем Tesla сможет одновременно предоставить игровой ускоритель для сеанса геймера, Quadro-ускоритель для сеанса дизайнера автомобиля и GPGPU-ускоритель для сеанса высокопроизводительных вычислений. Можно будет одновременно заниматься вычислениями и визуализацией в отдельном «облаке», получая высококачественную картинку на экран компьютера, планшетного ПК или телефона.
  • Ключ к созданию подобных архитектур — отказ от копирования данных туда-сюда. NVIDIA совместно с InfiniBand разрабатывает решение, которое позволит избежать постоянного копирования данных из системной памяти в видеопамять и обратно. Это позволит частично снять остроту проблемы полосы пропускания каналов связи, хотя всё равно всегда будут требоваться как можно более быстрые методы передачи данных.

Будем надеяться, что в погоне за раскрывающими перспективами облачных сред и распределённых вычислений компания не забудет совсем про сегмент, собственно, видеокарт для конечных ПК.

CUDA Toolkit 3.2 RC2

Вторая предварительная версия CUDA Toolkit 3.2 и новые бета-драйверы для него.

NVIDIA продолжает открытое тестирование следующей версии API CUDA и набора средств разработки для него. Второй кандидат на релиз исправляет некоторые ошибки в поддержке архитектуры Fermi и улучшает совместимость с компилятором Intel в Linux. Загрузить инструменты разработки и документацию можно со специальной страницы сайта NVIDIA для разработчиков.

Одновременно NVIDIA обновила и драйверы с предварительной поддержкой CUDA 3.2 для всех основных платформ:

Релиз Parallel Nsight 1.5 и обновлённые руководства по стерео

Новая версия среды разработки графических и GPGPU-приложений.

NVIDIA выпустила версию 1.5 своего набора средств для разработки графических и GPGPU-приложений Parallel Nsight, ранее известного как Nexus. Новая версия поддерживает интеграцию в Microsoft Visual Studio 2010, совместима с проектами CUDA Toolkit 3.2, содержит обновлённый отладчик CUDA-программ с поддержкой новых видеокарт GeForce и Quadro на базе Fermi, полностью поддерживает Direct3D 11 и DirectCompute и содержит ряд других изменений. Загрузить дистрибутив комплекта можно с сайта NVIDIA для разработчиков по ссылкам ниже:

Системные требования:

  • Операционная система Windows Vista/7/2008
  • Двуядерный процессор с частотой от 1,6 ГГц
  • 2 Гб оперативной памяти
  • Две видеокарты на базе G92 (GeForce 9800/Quadro FX) или более нового графического процессора для локальной отладки, одна для удалённой.
  • Microsoft Visual Studio 2008 SP1 или новее
  • NET Framework 3.5
  • Инструментальный драйвер версии 260.93: для Windows 32-bit (~100 Мб), для Windows 64-bit (~140 Мб).

Для получения одной бесплатной лицензии на стандартную версию пакета требуется регистрация на специальном сайте. Расширенная лицензия (с дополнительными функциями, такими как визуальный анализатор производительности и удалённая отладка) стоит USD 349 на год.

Также NVIDIA обновила документацию для разработчиков игр по обеспечению совместимости с системами стереовидения NVIDIA 3D Vision (PDF, ~1 Мб) и 3D Vision Surround (PDF, ~2 Мб). Будем надеяться, что игроделы будут ей следовать, и мы увидим в будущем больше игр с корректно работающим стереорежимом.

Бета-драйверы NVIDIA Quadro 260.78

Новый установщик и поддержка CUDA 3.2.

Предварительная версия драйвера для видеокарт профессиональной линейки Quadro 260.78 приносит поддержку недавно выпущенного CUDA 3.2 и «упакована» в новый установщик, уже знакомый нам по бета-драйверу 260.63 для игровых карт. Также традиционно обещаны улучшение совместимости и повышение производительности в профессиональных приложениях, и улучшен интерфейс панели управления NVIDIA. Драйверы поддерживают только новые видеокарты Quadro на базе архитектуры Fermi (600, 2000, 4000, 5000 и 6000). Загрузить можно по ссылкам ниже:

Руководитель NVIDIA об использовании CUDA на х86-процессорах

Во время своей программной речи соучредитель и глава NVIDIA Джен-Сан Хуанг объявил о том, что муссировалось уже неоднократно — о реализации поддержки CUDA набором инструкций x86-семейства процессоров.



Корпорация объявила о сотрудничестве с PGI (Портлендская Группа) для разработки компилятора PGI CUDA C для x86. С появлением последнего, разработчики смогут оптимизировать CUDA-приложения для x86 систем, которые не имеют графической карты с GPU от NVIDIA, таким образом, заставляя их использовать возможности многоядерных CPU и потоковую передачу SIMD, реализованные на текущий момент в центральных процессорах Intel и AMD для параллельных вычислений.

CUDA x86 планируется впервые продемонстрировать на предстоящей конференции Supercomputing conference (SC10), которая пройдет в ноябре. Когда решение выйдет в массы, пока неизвестно.

CUDA Toolkit 3.2

Предварительная версия для разработчиков.

NVIDIA анонсировала следующую версию средств для разработки CUDA Toolkit для API CUDA. В новой версии 3.2, как сообщается, разработчиков ожидают следующие новшества:

  • Новые библиотеки CUSPARSE (для операций с матрицами) и CURAND (генератор случайных чисел).
  • Улучшение производительности библиотек CUFFT и CUBLAS на архитектуре Fermi.
  • В состав CUDA Toolkit теперь включены библиотеки для работы с видео в формате H.264.
  • Добавлена поддержка новых продуктов Quadro и Tesla с объёмом буфера более 4 Гб, включая отладку на таких конфигурациях.
  • Отладка многопроцессорных конфигураций в cuda-gdb и Parallel Nsight.
  • Поддержка Fermi в cuda-memcheck.
  • Поддержка компилятора Intel C в 64-битных версиях Linux в NVCC.
  • Поддержка функций malloc() и free() в ядре CUDA-программы.
  • nvidia-smi поддерживает выдачу нескольких новых счётчиков производительности, включая загрузку GPU.

Доступ к предварительной версии CUDA Toolkit 3.2 осуществляется через бесплатную регистрацию на сайте NVIDIA для разработчиков.

NVIDIA официально представляет GeForce GTS 450

Новая видеокарта, пришедшая на смену легендарной GTS 250, имеет 192 ядра CUDA, поддержку DirectX 11 и призвана составить серьёзную конкуренцию AMD Radeon HD 5750—5770.

Спецификации GTS 450 включают:

  • 192 CUDA ядра;
  • 128-битный интерфейс памяти;
  • частоту GPU равную 783 МГц;
  • частоту шейдерного блока составляющую 1566 МГц;
  • 1 Гб видеопамяти GDDR5, работающей на частоте 3608 МГц;
  • в наличии имеются dual DVI и mini-HDMI выходы;
  • один 6-контактный разъем питания PCIe;
  • а также поддержка технологий 2-Way SLI, CUDA, PhysX, 3D Vision и NVIDIA Surround.

Цены на GeForce GTS 450 начинаются от 129 долл, и в продаже уже доступны видеокарты от таких производителей как: ASL, Asus, Colorful, ECS, EVGA, Gainward, Galaxy, Gigabyte, Innovision 3D, Jetway, KFA2, Leadtek, MSI, Palit, Point of View, PNY, Sparkle, Zotac и многих других.

Подробные обзоры вы можете найти по ссылкам ниже:

Обновление драйверов NVIDIA для MacOS X

Исправления для совместимости с новыми MacPro.

Похоже, что NVIDIA, неудовлетворённая частотой выхода сервисных обновлений операционной системы от Apple, теперь самостоятельно реализует программу поддержки данной платформы схожим с остальными платформами методом: выпуском отдельных пакетов драйверов, распространяемых через сайт компании. Новые драйверы со сложным индексом версии 256.00.05a23 поддерживают предлагаемые для апгрейда компьютеров MacPro специальные версии видеокарт GeForce GTX 285 (производства EVGA) и Quadro FX 4800 (производства PNY) и устраняют проблемы совместимости данных карт с выпуском MacOS, которым комплектуются новые (mid-2010) MacPro.

Одновременно обновился до версии 3.1.17 и отдельный драйвер для поддержки CUDA в MacOS X 10.6 Snow Leopard. Загрузить драйверы можно по ссылкам ниже:

Остаётся открытым вопрос, кто пожелает заменить комплектный Radeon 5770/5870 новых MacPro на видеокарту на базе NVIDIA прошлого поколения — планов по выпуску Fermi для Mac NVIDIA до сих пор не озвучила. Впрочем, разница между поколениями графики в MacOS не особенно заметна, ведь там нет DirectX, а состояние стека OpenGL в 2010, напомним, году, вызывает нервный смех, особенно при попытке использовать его в играх.

NVIDIA выпустила новый CUDA Toolkit 3.1

Разработчики, использующие мощности GPU для ускорения приложений, могут скачать и использовать новую версию CUDA Toolkit, которая доступна для Windows, Mac OS и Linux.

Пакет CUDA Toolkit 3.1 включает следующие изменения и дополнения:

  • GPUDirect позволяет другим устройствам прямой доступ к памяти CUDA;
  • поддержка параллелизма в 16 потоков позволяет использовать одновременно до 16 различных ядер на графических процессорах архитектуры Fermi;
  • runtime-драйвер совместимости приложений позволяет универсально использовать драйверы CUDA API с CUDA C Runtime и математическими библиотеками с помощью буфера обмена и миграции;
  • добавлены новые возможности языка CUDA C/C++:
    • поддержка printf() в коде устройства;
    • поддержка функций указателя и рекурсии облегчит портирование многих существующих алгоритмов для Fermi GPU;
  • Unified Visual Profiler теперь поддерживает CUDA C/C++ и OpenCL, а так же включает поддержку трассировки CUDA драйверов API;
  • математические библиотеки увеличили производительность, в часности:
    • улучшенна производительность отдельных трансцендентных функций log, pow, erf, и gamma;
    • значительно улучшена производительность для двойной точность FFT при исполнении на архитектуре графических процессоров Fermi для 2^N преобразований;
    • потоковый API теперь поддерживается в CUBLAS для перекрытия операций копирования и вычисления;
    • оптимизированы CUFFT Real-to-complex (R2C) и complex-to-real (C2R) для 2^N размеров данных;
    • улучшена производительность для GEMV и SYMV подпрограмм в CUBLAS;
    • оптимизирована реализация вычислений с двойной точностью по принципу разделения и взаимного использования программ для архитектуры Fermi;
  • новые и обновленные примеры SDK кода демонстрирует использование:
    • функции указателей в ядрах CUDA C/C++;
    • буфера обмена OpenCL/Direct3D;
    • Hidden Markov Model в OpenCL;
    • пример Microsoft Excel GPGPU, показывающий как запускать функции Excel на GPU.

Скачать новую версию CUDA Toolkit вы можете на официальной странице.

Драйвер GeForce 258.96 привносит поддержку GTX 460 и повышает производительность

Как и ожидалось, NVIDIA подготовила к анонсу GeForce GTX 460 новый графический драйвер с поддержкой GF104, и в настоящее время он доступен для скачивания на официальном сайте под номером 258.96.

Это драйверы выпуска 256 проходящие WHQL-сертификацию (версии от 256.xx до 259.xx). Данный набор драйверов поддерживает графические процессоры серии GeForce 6, 7, 8, 9, 100, 200, 300 и 400, а также графические процессоры ION для настольных решений.

Новое в выпуске 258.96:

  • добавлена поддержка GeForce GTX 460;
  • добавлена поддержка технологии NVIDIA 3D Vision Surround;
  • повышена производительность графических процессоров серии GeForce GTX 400 в нескольких играх для ПК (помимо ранее опубликованных улучшений и доработок в 265-м выпуске). Мы представляем примеры самых выдающихся достижений, полученных при использовании GeForce GTX 480. Результаты могут изменяться в зависимости от вашего GPU и системной конфигурации:
    • прирост производительности до 11% в Aliens vs. Predator (1920x1200 4xAA/16xAF — тесселяция включена);
    • прирост производительности до 7% в Crysis: Warhead (1920x1200 4xAA/16xAF — настройки уровня Gamer);
    • прирост производительности до 4% in H.A.W.X (SLI, 1920x1200 4xAA/16xAF — очень высокий уровень настроек);
    • прирост производительности до 10% в Just Cause 2 (SLI, 1920x1200 4xAA/16xAF — Concrete Jungle);
    • прирост производительности до 6% в Metro 2033 (1920x1200 4xAA/16xAF — тесселяция включена);
    • прирост производительности до 7% в Metro 2033 (SLI, 1920x1200 4xAA/16xAF — тесселяция включена);
    • прирост производительности до 10% in S.T.A.L.K.E.R.: Call of Pripyat (1920x1200 4xAA/16xAF);
    • прирост производительности до 12% in S.T.A.L.K.E.R.: Call of Pripyat (SLI, 1920x1200 4xAA/16xAF);
    • Прирост производительности до 4% in World in Conflict (SLI, 1920x1200 4xAA/16xAF);
  • обновление системного ПО PhysX до версии 9.10.0224;
  • обновление драйвера HD Audio до версии 1.0.15.0 (на поддерживаемых GPU);
  • многочисленные исправления ошибок.

Скачать драйвер для своей операционной системы вы можете на официальном сайте NVIDIA.