Rightware анонсировали бенчмарк Basemark CL # !

6 февраля 2012

Компания Rightware представила утилиту тестирования производительности Open CL в многоядерных системах.

Представленный тест производительности предназначен в первую очередь для тестирования скорости работы производителями оборудования, полупроводниковыми компаниями и их партнёрами для проведения оптимизаций выполнения расчётов посредством OpenCL .

Bsemark SL

Тест Basemark CL производит нагрузку посредством выполнения OpenCL  расчётов, которые очень похожи на типичные нагрузки. Именно по этой причине результат тестирования, выдаваемый этой программой, предельно объективен и релевантен. Язык OpenCL  может быть крайне полезен для увеличения производительности в играх и пользовательском интерфейсе, а также улучшения их внешнего вида и реалистичности за счёт внедрения игровых элементов и анимации, основанной на физических эффектах.
Представленная версия программы Basemark CL нацелена на настольные компьютеры. Компания Rightware уверяет, что расширенная версия этого же теста будет опубликована несколько позднее.

Bsemark SL

Bsemark SL

Несмотря на состоявшийся анонс загрузить программу пока ещё невозможно.

GPGPU, OpenCL, бенчмарки, тестирование, утилиты

Сохранить в контакте
http://nvworld.ru/news/rightware-anounced-basemark-cl/
http://nvworld.ru/news/rightware-anounced-basemark-cl/
«Rightware»
комментарии

NVDIA обещает 10% прирост производительности CUDA благодаря LLVM # !

30 января 2012

Разработчик микропроцессоров, компания NVIDIA, обновила CUDA библиотеку базовых классов для объектно-ориентированного GPGPU программирования, включив в неё для увеличения производительности низкоуровневую виртуальную машину — low level virtual machine (LLVM).

В прошлом году компания объявила о значительных изменениях в их проприетарном программном фреймворке CUDA , а несколько дней назад выпустила первую версию изменения, которое включает компилятор LLVM. По утверждению NVIDIA, LLVM обеспечит «постоянное 10% ускорение в производительности приложений».

Кроме того, что NVIDIA теперь восхваляет мощь LLVM компилятора, фирма также предлагает виртуальный профилировщик, который поможет программистам оптимизировать их код. Суть в том, что программирование для GPGPU  в большинстве случаев требует значительных оптимизаций, чтобы выжать каждую последнюю каплю скорости из GPU .

NVIDIA CUDA

Кроме LLVM компания расширила библиотеку обработки сигналов. Обычно самостоятельный цифровой сигнальный процессор используется исследователями для симуляции определённых нагрузок, но с растущей библиотекой обработки сигналов некоторые нагрузки могут быть запущены на графической платформе NVIDIA с включённым CUDA .

Но пока NVIDIA наслаждалась популярностью CUDA  в исследовательском сообществе, на горизонте появился серьёзный конкурент в лице OpenCL  — открытого языка GPGPU  вычислений. Тем не менее, NVIDIA утверждает, что им абсолютно безразлично какой именно язык используют программисты, до тех пор, пока они используют их графические платформы, продвигая CUDA  в качестве отличного способа улучшения продаж GPU  продуктов компании.

CUDA, GPGPU, NVIDIA, программирование

Сохранить в контакте
http://nvworld.ru/news/nvidia-promising-10percent-bost-lvm/
http://nvworld.ru/news/nvidia-promising-10percent-bost-lvm/
комментарии

Бета-драйверы NVIDIA для Linux 270.26 # !

16 февраля 2011

С поддержкой GeForce GTX 560 Ti.

Новый бета-драйвер NVIDIA версии 270.26 для Linux содержит следующие изменения:

  • добавлена поддержка видеокарт GeForce GTX 560 Ti;
  • добавлена опция конфигурации X Interactive, отключение которой улучшает совместимость продолжительных GPGPU -вычислений с Х-интерфейсом;
  • исправлен ряд ошибок в реализации VDPAU .

Загрузить дистрибутивы можно по ссылкам ниже. Поддерживаются видеокарты GeForce и Quadro на базе NV40 и более новых архитектур.

GeForce GTX 560 Ti, GPGPU, Linux, NVIDIA, драйвер

Сохранить в контакте
http://nvworld.ru/news/nvidia-linux-beta-drivers-27026/
http://nvworld.ru/news/nvidia-linux-beta-drivers-27026/
комментарии

oclHashcat — взломщик паролей с использованием GPU # !

21 января 2011

Забытый пароль вскоре может перестать быть проблемой. 

Развитие GPGPU -технологий осложнило жизнь системным администраторам и простым пользователям, заботящимся о защите своих данных: вскрытие пароля нормальной длины и сложности путём перебора, ранее считавшееся доступным лишь спецслужбам и группам хакеров, стало возможным почти для каждого — достаточно «натравить» на пароль современную видеокарту на базе логики AMD и NVIDIA. Программа oclHashcat, в отличие от специализированных GPGPU -утилит для вскрытия паролей баз данных и архивов RAR, является настоящим комбайном, умея подбирать хэши MD5, SHA1, NTLM, кэшированных паролей домена и паролей баз данных MySQL. Поддерживаются видеокарты как на базе AMD (OpenCL , требуется Catalyst 10.12 и ATI Stream SDK ), так и NVIDIA (CUDA , требуется драйвер 260.хх и новее), программа работает в Windows и Linux.

Производительность перебора для современных карт составляет:

  • GeForce GTX 480: 1041 M c/s
  • GeForce GTX 580: 1217 M c/s
  • Radeon HD 5870: 1211 M c/s
  • Radeon HD 6970: 1575 M c/s

Интересно, что программа умеет использовать и несколько GPU  одновременно в системах SLI /Crossfire (до 16, по заявлениям авторов). Будучи основанной на коде Hashcat, к программе могут подключаться словари аналогичного формата для дополнительного ускорения перебора. Лишь сложный консольный интерфейс отпугнёт желающих восстановить свой забытый пароль или узнать чужой.

CUDA, GPGPU, OpenCL

Сохранить в контакте
http://nvworld.ru/news/oclhashcat-gpu-password-bruteforcer/
http://nvworld.ru/news/oclhashcat-gpu-password-bruteforcer/
«Geeks3D»
комментарии

Плагин Intel для Adobe Premiere для технологии ускорения перекодирования видео Quick Sync # !

8 января 2011

Задействовать функции кодирования видео процессоров Sandy Bridge в известном редакторе.

Одним из новшеств архитектуры Sandy Bridge процессоров Intel Core iX второго поколения является наличие выделенных блоков в составе графического ядра для декодирования и кодирования видео в популярных форматах. Последняя функция под названием Quick Sync продемонстрировала неплохие результаты в обзорах, показав впечатляющие качество и скорость операций. Хотя ранее предполагалось, что данная функциональность будет доступна через универсальные API  вроде OpenCL, пока что единственный способ её использовать — использовать собственный Intel Media SDK  2.0, с библиотеками которого должны соединяться приложения. К выходу Sandy Bridge ряд разработчиков представил соответствующие приложения, но в основном это простенькие редакторы и конвертеры, рассчитанные на широкие массы конечных пользователей.

Для профессионалов Intel выпустила плагин для известного редактора Adobe Premiere Elements и Premiere Pro, позволяющий осуществлять экспорт проектов с аппаратным ускорением кодирования. Поддерживается кодирование видео в стандарты H.264 и MPEG -2, Intel обещает двух-трёхкратное ускорение для H.264 в сравнении с кодеками Adobe. Для работы плагина требуются 32- или 64-битная версия Windows 7, Adobe Premiere Elements версий 8-9 или Premiere Pro CS4-5, ну и сам процессор архитектуры Sandy Bridge, причём должно быть доступно встроенное графическое ядро — аппаратное ускорение будет недоступно при отключенном ядре или при запуске приложения на мониторе, обслуживаемом видеокартой.

Intel QuickSync plugin for Premiere

В ожидании новых процессоров плагин можно проверить и на существующих, в программном режиме, для чего потребуется установить Intel Media SDK 2.0.

Intel QuickSync plugin for Premiere

Пока что плагин предоставляется в демонстрационных целях, в будущем не исключено появление коммерческого продукта. Напомним, что в Premiere CS5 уже был реализован механизм использования аппаратного ускорения в Mercury Playback Engine, но он не ускоряет операции экспорта и финального кодирования, работает только через NVIDIA CUDA  и то лишь для небольшого количества видеокарт.

Купить книгу «Adobe Premiere Pro CS4. Официальный учебный курс» на OZON.ru

Adobe, GPGPU, Intel, Premiere, Sandy Bridge, видео

Сохранить в контакте
http://nvworld.ru/news/intel-video-gpgpu-plugin-for-premiere/
http://nvworld.ru/news/intel-video-gpgpu-plugin-for-premiere/
«Intel»
комментарии

VIA выпускает дискретную видеокарту eH1 # !

3 января 2011

Компания анонсировала низкопрофильную видеокарту для HTPC, с поддержкой стерео, Blu-ray и GPGPU.

Новый продукт компании под незамысловатым названием eH1 представляет собой дискретную низкопрофильную видеокарту с интерфейсом PCI Express  2.0. Ранее VIA не продвигала видеокарт под своей маркой, оставляя эту задачу дочернему подразделению S3 Graphics.

VIA eH1

В основе карты лежит, впрочем, продукт всё той же S3 Graphics — более чем годовой давности чип Chrome E5400. К штатным функциям поддержки Direct3D  10.1/OpenGL  3.1, VLD-ускорению декодирования H.264 и IDCT -ускорению для VC-1, OpenCL  1.0, поддержке двух дисплеев, подключаемых по HDMI  1.3, DisplayPort  или DVI  добавились (спасибо драйверам) поддержка OpenGL ES  2.0 и вывод стерео, вероятно в виде поддержки соответствующих режимов HDMI  1.4 для 3D-телевизоров.

VIA eH1

Конкретная модель eH1 оснащена 512 Мб видеопамяти DDR -3 на 64-бит шине, выходами DVI  Dual-Link и HDMI . TDP  карты не раскрывается, но предусмотрен небольшой вентилятор на GPU . Драйверы предлагаются пока лишь для Windows Vista/7 и Windows XP, причём последняя поддерживается лишь в 32-разрядной ипостаси и лишена поддержки Blu-ray.

Основное назначение данной видеокарты — апгрейд для платформ Nano/EPIA самой VIA с целью подключения дополнительных мониторов и повышения производительности. Последнее, впрочем, выглядит маловостребованным — последние модели на чипсетах VX900 и VN1000 и так содержат интегрированное графическое ядро с полным комплектом функций для работы с видео. Цены и сроки появления в продаже не сообщаются. VIA также обещает в будущем возможность группировать несколько таких видеокарт для поддержки многомониторных конфигураций. Может быть мы увидим наконец и двухпроцессорную видеокарту компании.

GPGPU, S3 Graphics, VIA, видеокарты

Сохранить в контакте
http://nvworld.ru/news/via-launch-graphics-board/
http://nvworld.ru/news/via-launch-graphics-board/
«VIA»
комментарии

Релиз CUDA Toolkit 3.2 # !

18 ноября 2010

Встречайте новую версию CUDA — официально.

После двухмесячного тестирования на кошечках программистах NVIDIA выпустила финальную версию пока что самого успешного GPGPU  API  CUDA  3.2. Об изменениях в новой версии CUDA  уже писалось неоднократно, так что желающие опробовать её в деле могут сразу загрузить всё необходимое с сайта NVIDIA для разработчиков.

NVIDIA CUDA logo

Одновременно вышли и новые отладочные драйверы видеокарт для разработчиков, традиционно, более новой версии, чем драйверы для конечных пользователей. Загрузить новые драйверы для основных платформ можно по ссылкам ниже:

CUDA, CUDA Toolkit, GPGPU, драйвер, программирование

Сохранить в контакте
http://nvworld.ru/news/cuda-toolkit-32-final/
http://nvworld.ru/news/cuda-toolkit-32-final/
«NVIDIA»
комментарии

CPU против GPU: новый раунд # !

8 ноября 2010

Плюс прогноз применимости GPGPU для суперкомпьютеров.

В этом году IBM публиковала два исследования, в которых сравнивалась производительность CPU  и GPU  в математических задачах. В первом случае центральный процессор IBM Power 7 опередил GeForce GTX 285, причём двухпроцессорная система на базе Intel Xeon показала лишь чуть меньший результат, во втором испытании модуль NVIDIA Tesla 2050 опередил всех соперников, но разрыв в производительности составил чуть более двухкратного для Power 7 и не дотянул до четырёхкратного над Xeon. И вот появилось новое исследование, от университетов Оксфорда и Ворвика, Великобритания, в котором системам на базе Xeon были противопоставлены модули Tesla разных поколений и пара «бытовых» видеокарт.

 Xeon vs CUDA results

Хотя для исполнения на CUDA  использованный тест NAS LU пришлось портировать с Fortran на C, результат представляет немалый интерес. Всего один четырёхъядерный процессор Xeon X5550, работающий на частоте 2,66 ГГц, смог показать лучший результат, чем GeForce 9800 GT с теоретической производительностью 500 GFLOPS . GeForce 8400 GS из-за ограниченного буфера памяти (256 Мб) смогла выполнить лишь один этап из трёх и показала ужасную производительность. Модули Tesla оправдали свою репутацию, но отрыв в производительности не превышал 10-кратного. Любопытно, что включение режима защиты памяти ECC  на Tesla 2050 стоило ей 20 % производительности, в том числе из-за потери 16 % объема видеопамяти на контрольные суммы.

Британские учёные не могли хотя бы частично не подтвердить свою репутацию. На основе полученных данных они попытались спрогнозировать производительность суперкомпьютерных систем на базе Tesla, сравнив их предсказанную производительность с хорошо себя зарекомендовавшими системами BlueGene /P от IBM.

Tesla vs BlueGene preview

Согласно предсказанию, традиционный подход к построению суперкомпьютеров выиграет по соотношению фактической производительности на Ватт, и в конечном итоге — по быстродействию вообще. Впрочем, GPU  уже сделали заявку на лидерство среди суперкомпьютеров, посмотрим, что сможет на неё ответить та же IBM.

CPU, CUDA, GPGPU, Tesla, суперкомпьютеры

Сохранить в контакте
http://nvworld.ru/news/cpu-vs-gpgpu-supercomputer/
http://nvworld.ru/news/cpu-vs-gpgpu-supercomputer/
«Genomeweb»
комментарии

Глава NVIDIA поделился видением будущего GPGPU-технологий # !

30 октября 2010

CUDA останется основным API, поддерживаемым NVIDIA.

Глава NVIDIA Jen-Hsun Huang в интервью британскому отделению издания ZDNet ответил на вопросы о будущем GPGPU -технологий. Мы приводим выдержку высказанных им суждений:

Jen-Hsun Huang

  • NVIDIA активно поддерживает открытый стандарт OpenCL, тем более что Khronos Group в настоящее время возглавляет сотрудник компании. NVIDIA первой реализовала поддержку OpenCL, причём она всё еще считается лучшей в отрасли, и будет поддерживать OpenCL и дальше.
  • Технологии меняются очень быстро, производительность увеличивается четырёхкратно каждые два года, новые функции внедряются постоянно. В силу этого NVIDIA концентрируется на CUDA, не желая немедленно «выкатывать» новый общий стандарт. Тем более, что OpenCL такого внимания и не требует — там есть множество людей, в том числе из IBM, AMD, Intel, и NVIDIA не нужно тащить всё в одиночку.
  • CUDA получил большее распространение, чем OpenCL, в силу большей истории и инвестиций в разработку, большего числа работающих с ним людей, большего качества инструментов разработки, компилятора, надёжности рабочей среды.
  • NVIDIA не пытается каким-то способом полностью заменить CPU или нарушить их работу. Операционные системы и офисные приложения будут продолжать работать на CPU — но будет возможно прибегнуть к силе GPU для того, чтобы «проломить» определённые задачи.
  • Будущее за гетерогенной средой, в которой встретятся нарастившие мощь векторной обработки данных CPU и GPU с параллельной обработкой данных, научившиеся решать более сложные типы задач. В такой среде все приложения будут работать невероятно быстро.
  • Сейчас ситуация с приложениями такая, что они не работают, не работают, а потом раз — и работают очень быстро. Технологии вроде виртуальной памяти и синхронизации данных в памяти облегчат программирование. В целом будет лучше, если приложения будут работать сразу, пусть и лишь в три раза быстрее. Затем можно будет заниматься оптимизацией.
  • Сейчас графические процессоры лучше всего работают с одним приложением, так устроен их конвейер, следствие stateful-подхода. К примеру, одна большая программа исполняется на многих GPU. В будущем будет иная ситуация: множество приложений, использующих один GPU. NVIDIA работает над тем, чтобы обеспечить возможность использования обоих подходов.
  • В будущей архитектуре сервер с одним модулем Tesla сможет одновременно предоставить игровой ускоритель для сеанса геймера, Quadro-ускоритель для сеанса дизайнера автомобиля и GPGPU-ускоритель для сеанса высокопроизводительных вычислений. Можно будет одновременно заниматься вычислениями и визуализацией в отдельном «облаке», получая высококачественную картинку на экран компьютера, планшетного ПК или телефона.
  • Ключ к созданию подобных архитектур — отказ от копирования данных туда-сюда. NVIDIA совместно с InfiniBand разрабатывает решение, которое позволит избежать постоянного копирования данных из системной памяти в видеопамять и обратно. Это позволит частично снять остроту проблемы полосы пропускания каналов связи, хотя всё равно всегда будут требоваться как можно более быстрые методы передачи данных.

Будем надеяться, что в погоне за раскрывающими перспективами облачных сред и распределённых вычислений компания не забудет совсем про сегмент, собственно, видеокарт для конечных ПК.

CUDA, GPGPU, NVIDIA, виртуализация, суперкомпьютеры

Сохранить в контакте
http://nvworld.ru/news/nvidia-see-future-in-gpu/
http://nvworld.ru/news/nvidia-see-future-in-gpu/
«ZDNet»
комментарии

Серверы Dell с готовностью к GPGPU и виртуализации # !

27 октября 2010

Модульный сервер позволяет установить до 16 GPU-карт PCI Express.

Компания Dell для своих новых серверов линейки PowerEdge C Series предусматривает специальный блок расширения PowerEdge C410x, представляющий собой платформу для установки карт с интерфейсом PCI Express  x16.

Dell PowerEdge C 410x

Данный модуль высотой 3U позволяет установить 16 GPU -карт (10 спереди и 6 сзади) с TDP  до 225 Вт каждая, и рассчитан прежде всего на установку GPGPU  модулей NVIDIA Tesla M2050 с 448 ядрами CUDA  архитектуры Fermi и тремя или шестью гигабайтами ECC  GDDR -5 памяти.

Dell PowerEdge C 410x

Питание обеспечивают 4 блока мощностью 1400 Вт каждый, за охлаждение отвечают восемь 92-мм вентиляторов. Блоки питания и вентиляторы поддерживают отказоустойчивость и «горячую» замену. Модули карт поддерживают добавление на ходу, но не замену.

Dell PowerEdge C 410x

Совокупная вычислительная мощность платформы — более 16 000 GFLOPS  и может быть разделена между 8 серверами PowerEdge C Series, подключаемыми с помощью внешних соединений PCI Express  I-PASS к специальным интерфейсным картам NVIDIA HIC. Программная поддержка решения пока реализована лишь в Red Hat Enterprise Linux.

Dell уже поставила подобную систему как часть суперкомпьютера Lincoln для Национального суперкомпьютерного центра США, с вычислительной производительностью в 47 TFLOPS. Но подобный продукт, без сомнения, найдёт спрос и у корпоративных потребителей в области решений для виртуализации, поскольку и Microsoft, и VmWare уже объявили, что следующее поколение их продуктов будет поддерживать виртуализацию графического процессора, что позволит исполнять «тяжёлые» графические приложения в виртуальных машинах. Причём предварительная версия технологии Microsoft RemoteFX уже доступна в открытом для бета-тестирования Windows Server 2008 R2 SP1 Release Candidate.

Dell, GPGPU, PCI Express, Tesla, виртуализация, суперкомпьютеры

Сохранить в контакте
http://nvworld.ru/news/dell-poweredge-gpu-ready-servers/
http://nvworld.ru/news/dell-poweredge-gpu-ready-servers/
«Dell»
комментарии

Релиз Parallel Nsight 1.5 и обновлённые руководства по стерео # !

17 октября 2010

Новая версия среды разработки графических и GPGPU-приложений.

Parallel Nsight

NVIDIA выпустила версию 1.5 своего набора средств для разработки графических и GPGPU -приложений Parallel Nsight, ранее известного как Nexus. Новая версия поддерживает интеграцию в Microsoft Visual Studio 2010, совместима с проектами CUDA Toolkit 3.2, содержит обновлённый отладчик CUDA -программ с поддержкой новых видеокарт GeForce и Quadro на базе Fermi, полностью поддерживает Direct3D  11 и DirectCompute и содержит ряд других изменений. Загрузить дистрибутив комплекта можно с сайта NVIDIA для разработчиков по ссылкам ниже:

Системные требования:

  • Операционная система Windows Vista/7/2008
  • Двуядерный процессор с частотой от 1,6 ГГц
  • 2 Гб оперативной памяти
  • Две видеокарты на базе G92 (GeForce 9800/Quadro FX) или более нового графического процессора для локальной отладки, одна для удалённой.
  • Microsoft Visual Studio 2008 SP1 или новее
  • NET Framework 3.5
  • Инструментальный драйвер версии 260.93: для Windows 32-bit (~100 Мб), для Windows 64-bit (~140 Мб).

Для получения одной бесплатной лицензии на стандартную версию пакета требуется регистрация на специальном сайте. Расширенная лицензия (с дополнительными функциями, такими как визуальный анализатор производительности и удалённая отладка) стоит USD 349 на год.

Parallel Nsight

Также NVIDIA обновила документацию для разработчиков игр по обеспечению совместимости с системами стереовидения NVIDIA 3D Vision (PDF, ~1 Мб) и 3D Vision Surround (PDF, ~2 Мб). Будем надеяться, что игроделы будут ей следовать, и мы увидим в будущем больше игр с корректно работающим стереорежимом.

3D Vision, 3D Vision Surround, CUDA, GPGPU, NVIDIA, Parallel Nsight, драйвер, программирование, стерео

Сохранить в контакте
http://nvworld.ru/news/parallel-nsight-15-release/
http://nvworld.ru/news/parallel-nsight-15-release/
«NVIDIA»
комментарии

Microsoft патентует GPU-ускорение кодирования видео # !

13 октября 2010

Еще один, к счастью, неудавшийся пример патентования слишком общих идей.

Сейчас использование мощностей графических процессоров для операций с видео стало обыденностью. Многие владельцы современных видеокарт на базе NVIDIA воспользовались продуктами от Badaboom или MotionDSP с данной функциональностью. Тем удивительнее стало обнаружение факта, что на подобные технологии кем-то получен патент, и этот кто-то — Microsoft. Буквально на днях Бюро по регистрации патентов и торговых марок США утвердило за компанией патент за номером 7,813,570 под многообещающим заголовком «Accelerated video encoding using a graphics processing unit».

Microsoft patent FIG1

Первые реакции на выдачу такого патента были ожидаемы — попытка компании-монополиста наложить лапу на перспективный рынок, шаг против прогресса, заговор против производителей GPU … Однако, изучение содержания патента позволяет существенно снизить накал страстей.

Прежде всего, заявка на патент была отправлена в Бюро… 22 октября 2004 года. В ту пору возможность использования графических процессоров для общих вычислительных задач еще была предметом научных исследований. К примеру, в 2004 году университетом Стэнфорда была выпущена программа GPUBench, как иллюстрация к обсуждению перспектив GPGPU  перед выставкой SIGGRAPH 2004 (обсуждавшиеся тогда вопросы сегодня могут вызвать лёгкую улыбку).

Microsoft patent FIG2

Во-вторых, указанный патент покрывает лишь случай использования GPU  для выполнения операции определения движения — нахождения движущихся объектов в кадре и расчёта векторов движения и информации, необходимой для последующего восстановления видео при воспроизведении, как это определено в стандартах MPEG -1/2. Все остальные операции выполняет центральный процессор. Современные программы кодирования с применением GPGPU -технологий не выделяют какие-то этапы кодирования, используя GPU  как математический сопроцессор для всех или почти всех операций с видеопотоком. Ну и, согласно тексту патента, работа с видео должна была осуществляться путём помещения кадров в текстуры, обработке их с помощью пиксельных и вершинных шейдеров образца Direct3D  9.0 и использованием Z-буфера для хранения промежуточных результатов операции. Нынешнее программное обеспечение видеокодирования с функциями GPGPU  использует высокоуровневые интерфейсы вроде CUDA  или ATI Stream.

В целом, заявка на пресловутый патент, вероятно, была подана в рамках разработки следующих версий приложений Windows Movie Maker/Movie Encoder для будущей операционной системы Longhorn, но проект умер вместе с самим Longhorn. К настоящему моменту Microsoft пришла к собственному GPGPU  API  DirectCompute в составе DirectX  11 и врядли нуждается в патентовании схемы использования аппаратного ускорения шестилетней давности. Так что история с патентом за номером 7,813,570 является лишь иллюстрацией неповоротливости и ограниченности патентной системы, с непоправимым опозданием «защитившей» права на давно потерявшую актуальность разработку.

Купить Windows 7 Home Premium на OZON.ru

GPGPU, Microsoft, видео

Сохранить в контакте
http://nvworld.ru/news/microsoft-gpu-video-encoding-patent/
http://nvworld.ru/news/microsoft-gpu-video-encoding-patent/
комментарии

CUDA Toolkit 3.2 # !

14 сентября 2010

Предварительная версия для разработчиков.

NVIDIA анонсировала следующую версию средств для разработки CUDA  Toolkit для API  CUDA . В новой версии 3.2, как сообщается, разработчиков ожидают следующие новшества:

  • Новые библиотеки CUSPARSE (для операций с матрицами) и CURAND (генератор случайных чисел).
  • Улучшение производительности библиотек CUFFT и CUBLAS на архитектуре Fermi.
  • В состав CUDA  Toolkit теперь включены библиотеки для работы с видео в формате H.264.
  • Добавлена поддержка новых продуктов Quadro и Tesla с объёмом буфера более 4 Гб, включая отладку на таких конфигурациях.
  • Отладка многопроцессорных конфигураций в cuda-gdb и Parallel Nsight.
  • Поддержка Fermi в cuda-memcheck.
  • Поддержка компилятора Intel C в 64-битных версиях Linux в NVCC.
  • Поддержка функций malloc() и free() в ядре CUDA -программы.
  • nvidia-smi поддерживает выдачу нескольких новых счётчиков производительности, включая загрузку GPU .

NVIDIA CUDA logo

Доступ к предварительной версии CUDA  Toolkit 3.2 осуществляется через бесплатную регистрацию на сайте NVIDIA для разработчиков.

CUDA, CUDA Toolkit, GPGPU, NVIDIA

Сохранить в контакте
http://nvworld.ru/news/cuda-toolkit-32/
http://nvworld.ru/news/cuda-toolkit-32/
«NVIDIA»
комментарии

NVIDIA выпустила новый CUDA Toolkit 3.1 # !

22 июля 2010

Разработчики, использующие мощности GPU для ускорения приложений, могут скачать и использовать новую версию CUDA Toolkit, которая доступна для Windows, Mac OS и Linux.

CUDA

Пакет CUDA  Toolkit 3.1 включает следующие изменения и дополнения: 

  • GPUDirect позволяет другим устройствам прямой доступ к памяти CUDA ;
  • поддержка параллелизма в 16 потоков позволяет использовать одновременно до 16 различных ядер на графических процессорах архитектуры Fermi;
  • runtime-драйвер совместимости приложений позволяет универсально использовать драйверы CUDA  API  с CUDA  C Runtime и математическими библиотеками с помощью буфера обмена и миграции;
  • добавлены новые возможности языка CUDA  C/C++:
    • поддержка printf() в коде устройства;
    • поддержка функций указателя и рекурсии облегчит портирование многих существующих алгоритмов для Fermi GPU ;
  • Unified Visual Profiler теперь поддерживает CUDA  C/C++ и OpenCL , а так же включает поддержку трассировки CUDA  драйверов API ;
  • математические библиотеки увеличили производительность, в часности:
    • улучшенна производительность отдельных трансцендентных функций log, pow, erf, и gamma;
    • значительно улучшена производительность для двойной точность FFT при исполнении на архитектуре графических процессоров Fermi для 2^N преобразований;
    • потоковый API  теперь поддерживается в CUBLAS для перекрытия операций копирования и вычисления;
    • оптимизированы CUFFT Real-to-complex (R2C) и complex-to-real (C2R) для 2^N размеров данных;
    • улучшена производительность для GEMV и SYMV подпрограмм в CUBLAS;
    • оптимизирована реализация вычислений с двойной точностью по принципу разделения и взаимного использования программ для архитектуры Fermi;
  • новые и обновленные примеры SDK  кода демонстрирует использование:
    • функции указателей в ядрах CUDA  C/C++;
    • буфера обмена OpenCL /Direct3D ;
    • Hidden Markov Model в OpenCL ;
    • пример Microsoft Excel GPGPU , показывающий как запускать функции Excel на GPU .

CUDA

Скачать новую версию CUDA Toolkit вы можете на официальной странице.

CUDA, CUDA Toolkit, Fermi, GPGPU, NVIDIA, программирование

Сохранить в контакте
http://nvworld.ru/news/cuda-toolkit-31/
http://nvworld.ru/news/cuda-toolkit-31/
комментарии

AMD предлагает инвестировать средства на поддержку разработчиков программ для архитектуры Fusion # !

8 июля 2010

AMD имеет большие планы на Fusion и планирует выделять инвестиции, направленные на создание прочной базы разработчиков.

В интервью PC World, директор AMD по продажам Fusion Джон Тейлор объявил о планах AMD по инвестированию в программное обеспечение для разработки приложений, предназначенных для нового поколения процессоров. Тейлор также отметил, что AMD будет вкладывать средства в компании, занимающиеся разработкой оборудования и комплектующих для поддержки архитектуры Fusion.

Логотип Fusion

Тейлор отметил, что целью AMD является ускорение внедрения уникальных решений и вычислительных приложений, специально разработанных для использования комплексной архитектуроы Fusion. Он отметил, что графические процессоры могут, среди прочего, ускорять приложения рендеринга и обеспечивать безопасность браузеров.

Ранее AMD и NVIDIA поддержали усилия по использованию GPU  при вычислениях. AMD оказывает помощь разработчикам OpenCL , а NVIDIA оказывает содействие развитию CUDA  в течение многих лет.

Джон Тэйлор

Тейлор подтвердил, что AMD уже сделала некоторые, связанные с Fusion, стратегические инвестиции, но не раскрыл название компаний, принимающих участие в программе. 

Подробнее вы можете прочитать на сайте pcworld.com (на английском).

AMD, CUDA, Fusion, GPGPU, NVIDIA, OpenCL, инвестирование, разработчики

Сохранить в контакте
http://nvworld.ru/news/amd-funding-fusion-developers/
http://nvworld.ru/news/amd-funding-fusion-developers/
комментарии


Сокращения и аббревиатуры

API

Application Programming Interface

Заданный набор функций для использования программистами. Примеры: DirectX, OpenGL, CUDA

CPU

Central Processing Unit

Центральный процессор — исполнитель машинных инструкций, часть аппаратного обеспечения компьютера или программируемого логического контроллера, отвечающий за выполнение операций, заданных программами.

CUDA

Compute Unified Device Architecture

Cпециальные библиотеки языка С для использования шейдерных блоков графических процессоров NVIDIA в универсальных (неграфических) вычислениях.

DDR

Double Data Rate

Технология обмена с памятью, при которой передача данных осуществляется дважды: на фронте сигнала и на спаде. За счет этого при той же частоте можно передать вдвое больше данных.

DVI

Digital Visual Interface

Интерфейс для передачи изображения устройствам в цифровом виде по одному или двум высокоскоростным каналам передачи данных TMDS.

Direct3D

Direct3D

Интерфейс вывода трёхмерных примитивов. Часть API DirectX.

DirectX

Microsoft DirectX

Набор API функций, разработанных для решения задач, связанных с игровым и видеопрограммированием под Microsoft Windows.

DisplayPort

DisplayPort

Новый стандарт сигнального интерфейса для цифровых дисплеев, предполагается к использованию в качестве наиболее современного интерфейса соединения аудио и видеоаппаратуры, в первую очередь для соединения компьютера с дисплеем, или компьютера и систем домашнего кинотеатра.

ECC

Error Correcting Code

Специальная технология оперативной памяти, при которой к передаваемым по шине памяти данным добавляется код избыточности, позволяющий обнаружить и исправить ошибочное значение одного бита на каждые 8 бит передаваемых данных.

GDDR

Graphics Double Data Rate

Вариант памяти DDR с рядом дополнительных возможностей специально для использования в качестве видеопамяти

GFLOPS

Giga FLoating point Operations per Second

Число миллиардов операций с вещественными числами (с плавающей запятой) в секунду. Используется как мерило производительности процессора или компьютера в целом.

GPGPU

General Purpose Graphics Processors Usage

Общее обозначение использования вычислительной производительности графических процессоров для неграфических применений. Поначалу использовались пиксельные шейдеры для передачи инструкций и текстуры для хранения данных, в настоящее время — специальные API, такие как OpenCL и CUDA.

GPU

Graphic Processor Unit

Обозначение современных графических процессоров видеокарт. Исходно понятие введено NVIDIA как обозначение графических процессоров с функцией аппаратного ускорения геометрических вычислений (Geometric Processing Unit), но в такой форме трактовка не прижилась.

HDMI

High Definition Multimedia Interface

Цифровой последовательный интерфейс для подключения аудиовидеотехники и дисплеев. Позволяет передавать в одном проводе видеосигнал высокой четкости и многоканальный звук, имеется ограниченная обратная совместимость с DVI.

IDCT

Inverse Discrete Cosine Transformation

Обратное косинусное дискретное преобразование.

MPEG

Motion Picture Experts Group

Экспертная группа, занимающаяся разработчкой стандартов кодирования для видео и звука. Ниболее известные стандарты: MPEG-1 (VideoCD), MPEG-2 (DVD), MPEG-4 ASP (DivX), MPEG-4 AVC (H.264, Blu-ray).

OpenCL

Open Computing Language

API программирования универсальных вычислений, разработанный фирмой Khronos. Платформонезависимый API может использовать для непосредственно вычислений интерфейсы взаимодействия с оборудованием, предоставленные разработчиками оборудования, а также центральный процессор и GLSL.

OpenGL

Open Graphics Library

Платформонезависимый API программирования компьютерной графики. Разрабатывается консорциумом OpenGL Architecture Review Board (ARB) и фирмой Khronos.

OpenGL ES

OpenGL for Embedded Systems

Упрощённый подстандарт OpenGL, предназначенный для интегрируемых/мобильных решений. Версии 1.х использовали фиксированные функции, версия 2.0 — шейдеры.

PCI Express

Peripheral Component Interconnect Express

Новая шина для установки плат расширения и связи между компонентами компьютера, сменившая PCI и AGP. Последняя версия 3.0, полоса пропускания до 32 Гб/с.

SDK

Software Development Kit

Набор инструментов для разработки приложений.

SLI

Scalable Link Interface

Технология NVIDIA, позволяющая использовать мощности нескольких видеокарт для обработки трехмерного изображения. Также обозначается специальный интерфейс для связи видеокарт между собой. Похожая технология 3DFX называлась Scan Line Interleave.

TDP

Thermal Design Power

Расчётное максимальное тепловыделение чипа или устройства. С учётом, что практически вся потребляемая энергия в итоге преобразуется в тепло, характеристика отражает и общее энергопотребление.

VDPAU

Video Decode and Presentation API for Unix

Открытый API для ускорения декодирования и рендеринга видео в среде Unix, разработанный NVIDIA.

VLD

Variable Length Decoding