Новости про GPGPU

Mozilla работает над Direct2D для Firefox

Компания Mozilla Foundation работает над реализацией ускорения Direct2D для своего браузера, популярность которого постоянно растёт.

С помощью Direct2D браузер сможет воспользоваться мощностями графического процессора для ускорения своей работы. Конечно, в данном случае речь не идёт об увеличении пропускной способности: браузер будет ускорять рендеринг страниц.

Пока реализация Direct2D находится в альфа-состоянии, поэтому до реализации технологии в какой-нибудь финальной версии пройдёт, возможно, год и более.

Между прочим, Internet Explorer 9 также будет максимально использовать возможности видеокарт для ускорения своей работы.

Cray запускает в производство суперкомпьютер с GPU NVIDIA Tesla

Вычислительные модули NVIDIA Tesla обеспечат 17 000 GFLOPS.

Известный изготовитель высокопроизводительных компьютеров Cray Ink. объявила о запуске новой линейки вычислительных кластеров CX1000. Наибольший интерес в новой линейке представляет модель CX1000-G, предлагающая использование GPGPU возможностей современных графических процессоров NVIDIA. CX1000-G допускает установку до 9 блоков, каждый из которых содержит два процессора Intel Xeon 5600, до 48 Гб оперативной памяти и два процессора NVIDIA Tesla M1060. С учётом производительности одного модуля Tesla в 933 GFLOPS, общая производительность кластера составит почти 17000 GFLOPS даже без учёта вычислительных возможностей центральных процессоров Intel.

Надо отметить, что графические процессоры уже прочно «прописались» в мире суперкомпьютеров. В прошлом году в список самых производительных компьютеров TOP500 ворвался китайский компьютер Tianhe-1. Производительность петафлопного уровня и пятое место в списке тогда обеспечили 2560 видеокарт AMD Radeon HD 4870×2.

Релиз CUDA Toolkit 3.0

К выходу Fermi — новая версия инструментов CUDA для разработчиков.

В CUDA 3.0 сделаны значительные изменения:

  • поддержка новой архитектуры Fermi;
  • поддержка классов C++;
  • взаимодействие CUDA и OpenCL с Direct3D 9/10/11 и OpenGL;
  • возможность использования в одном приложении и CUDA Runtime, и CUDA Driver API.
  • многократное повышение производительности при отладке в cuda-dbg и аппаратное ускорение отладки для CUDA Driver API на видеокартах с архитектурой Fermi;
  • утилита CUDA Memory Checker для поиска ошибок выравнивания данных и переполнения памяти;
  • ряд важных улучшений в OpenCL.

Загрузить CUDA SDK, документацию и отладочные драйверы для Windows, Linux и MacOS можно со специальной страницы сайта NVIDIA для разработчиков.

Аппаратное ускорение в Internet Explorer 9

Следующая версия веб-браузера от Microsoft будет использовать графический процессор для ускорения рендеринга страниц.

На конференции MIX10 Microsoft опубликовала предварительную технологическую версию следующего поколения своего веб-браузера. Особый упор был сделан на использование аппаратного ускорения GPU в новом движке.

Прежде всего, новый движок осуществляет рендеринг изображений и текстов с помощью API Direct2D, появившегося в Windows 7 и доступного в качестве обновления для Windows Vista. Рендеринг конечного изображения страницы занимает достаточно большой процент общего времени отображения страницы и использование нового API, специально разработанного для ускорения вывода двухмерной графики и шрифтов, позволяет заметно ускорить этот процесс.

Также в IE 9.0 будет реализовано аппаратное ускорение стандарта векторной графики SVG. Операции с векторной графикой всегда отличались ресурсоёмкостью, и вычислительные мощности GPU пришлись как нельзя кстати. Да и в целом, поддержка SVG ранее в браузерах от Microsoft отсутствовала как класс.

Помимо GPU-ускорения, разработчики следующей версии Internet Explorer не остались в стороне и от еще одной актуальной технологии — многопоточности. Интерпретатор JavaScript «Chakra» использует отдельный поток для компиляции JS на лету и оптимизирован для новых процессоров Intel Core i7. Microsoft приводит результаты бенчмарков, согласно которых IE9 встал вровень со своими конкурентами по производительности JavaScript.

Также обещано очередное улучшение соответствия веб-стандартам, включая HTML 5, DOM, CSS3. Правда, в известном тесте Acid 3 технологическое демо Internet Explorer пока набирает лишь 55 баллов из 100. В любом случае, новая версия браузера будет востребована пользователями офисных и корпоративных продуктов самой Microsoft, для прочих же пользователей, в соответствии с решением Европейской антимонопольной комиссии, будет сделан экран выбора браузера при установке операционной системы.

Несколько видео от разработчиков:

Одноплатный компьютер с поддержкой CUDA от GE

Решение для промышленности и специальных примененений, включающее возможности GPGPU.

Новый продукт в линейке одноплатных ПК OpenVPX от GE IPN250 и так обеспечивает неплохие характеристики, включая процессор Intel Core 2 Duo 2,26 ГГц, 8 Гб оперативной памяти DDR-3, 10 Гбит/с Ethernet и шину PCI-Express, но к этому добавлена «изюминка» в виде графического процессора NVIDIA GeForce GT 240. 96 шейдерных процессоров обеспечивают вычислительную производительность до 390 GFLOPS и поддержку CUDA и OpenCL, что отвечает растущему интересу к GPGPU-технологиям в самых различных областях.

Такой одноплатный компьютер в промышленном исполнении послужит «мозгом» для всевозможных устройств, станков и приборов, довольствуясь энергопотреблением не более 100 Вт. Впрочем, по некоторым намёкам на сайте GE, основным заказчиком подобных решений видятся военные. В комплекте поставляются CUDA-оптимизированные библиотеки AXISLib-VSIPL для математических задач и цифровой обработки сигналов.

Swan — преобразователь программ CUDA в OpenCL

Инструмент для собирающихся переводить имеющиеся GPGPU программы с CUDA на OpenCL.

Консольное приложение Swan позволяет в среде Linux автоматически преобразовать исходный код ядра CUDA-программ в ядро OpenCL. Программа заменяет вызовы функций и создаёт новые точки входа. Также предлагается собственный «абстрактный» API, позволяющий создавать программы, равно легко конвертируемые с помощью Swan в CUDA или OpenCL.

Конечно, программа имеет множество ограничений, пока что не поддерживается работа с несколькими устройствами и конвертация для выполнения CUDA/OpenCL кода на CPU, как и использование возможностей C++ в исходном тексте CUDA-программы. Будем надеяться, что подобные экономящие время инструменты не останутся без развития, благо программа выпущена под GPL и исходный код доступен. Загрузить утилиту можно с официального сайта.

Мир меняется благодаря CUDA

NVIDIA на своём канале YouTube опубликовала примечательный 5-минтуный видеоролик, посвящённый применению CUDA в реальных приложениях.

За 5 минут перед нами выступает семь представителей компаний, использующих в своих продуктах вычислительные мощности NVIDIA Tesla, Quadro и GeForce GPUs.

Сегменты видео:

  • 0:00 – 0:38: Siemens Medical (Roee Lazebnik) — применение CUDA, Quadro и 3D Vision в медицине.
  • 0:39 – 1:19: Kaspersky Lab (Roel Schouwenberg) — ускорение определения вирусов с помощью CUDA и Tesla.
  • 1:20 – 1:42: Muvee (Elvin Low) — применение CUDA и мощностей GeForce для создания видеослайдшоу.
  • 1:43 – 2:30: CyberLink (Tom Vaughan) — улучшенное определение лиц с помощью мощностей CUDA, GeForce, а также просмотр 3D Blu-ray с помощью 3D Vision.
  • 2:31 – 3:20: Agilent (Amolak Badesha) — использование CUDA, Quadro и 3D Vision для улучшения внешнего вида схем.
  • 3:21 – 4:13: Adobe (Karl Soulé) — использование CUDA на картах Quadro, GeForce для ускорения предварительного просмотра, наложения эффектов и рендеринга в новом Premiere Pro.
  • 4:14 – 5:12: MotionDSP (Mike Sonders) — применение CUDA и GeForce для улучшения некачественного видео.

Дистрибутив Yellow Dog Linux обзавёлся поддержкой CUDA

Компания Fixstars, выпускающая достаточно известный дистрибутив Yellow Dog Linux, подготовила специальную версию с интегрированной поддержкой CUDA.

Новая CUDA-редакция Yellow Dog Enterprise Linux поставляется с интегрированными средствами разработки CUDA Toolkit, CUDA SDK и Visual Profiler, а также с предустановленным драйвером NVIDIA и средой разработки Eclipse, для которой Fixstars разработала специальный плагин, приближающий возможности разработки CUDA-программ к известному продукту NVIDIA Parallel NSight для Windows (ранее известного как Nexus). В этой версии Yellow Dog Enterprise Linux обеспечена возможность быстрого переключения между CUDA toolkit и runtimes версий 3.0, 2.3 и 2.2 без необходимости переустановки, для каждого приложения индивидуально через установку переменных среды. Дистрибутив проходит жёсткое тестирование в GPGPU-системах. Согласно распространяемым компанией результатам бенчмарков, оптимизации для GPGPU в дистрибутиве YDEL позволяют добиться до 9% преимущества в производительности в сравнении с другими популярными дистрибутивами Linux.

Для коммерческих применений Yellow Dog Enterprise Linux поставляется в форме подписки ценой 400 USD в год на компьютер/сервер. Система доступна бесплатно для образовательных целей. Fixstars также предлагает готовые компьютеры и серверы, оснащённые вычислительными модулями NVIDIA Tesla и с предустановленной CUDA-редакцией YDEL.

NVIDIA ускоряет работу движка Adobe Mercury Playback

Как мы уже сообщали, новая версия профессиональной программы для монтажа и обработки видео, Premiere Pro от компании Adobe, будет оснащена переработанным движком Mercury Playback Engine.

Этот движок с помощью видеокарт NVIDIA позволяет значительно ускорить скорость рендеринга сцен с наложением множества слоёв, с добавлением эффектов и проч. Также благодаря CUDA и видеокартам NVIDIA Quadro ускоряется и предварительный просмотр результатов монтажа.

Всё это стало возможным благодаря тесной работе разработчиков из Adobe с командой специалистов из NVIDIA во главе с Андрю Креши, который рассказал немного о работе своей команды в небольшом видеоролике.

NVIDIA In A Minute: NVIDIA Fuels Adobe's New Mercury Playback Engine

GPGPU станет возможным прямо в веб-браузере

Из-за спины стандарта трёхмерной графики в Интернет WebGL уже выглядывает…WebCL?

Основанный на OpenGL ES WebGL уже продемонстрировал способность обеспечить новое качество и скорость графики в Интернет, но стандарт может найти и неграфические применения, чему свидетельствуют новые публикации и демонстрации.

В демонстрации приводится пример ускорения операций перемножения матриц путем помещения данных в текстуру и осуществления умножения в шейдере GLSL. Как сообщает автор, умножение матриц 1024x1024 на GPU занимает 5 секунд — заметное ускорение в сравнении с 35 секундами для той же задачи при расчётах на CPU. Для использования демонстрации необходим браузер на основе последней версии Webkit, такой как Apple Safari.

Но не только отдельные энтузиасты изучают потенциал использования графических процессоров веб-приложениями. Для API Jetpack, разрабатываемого в Mozilla Labs для браузера Firefox, изучается возможность ускорения практически любого JavaScript-кода с помощью GPU. Уже существует первая реализация, использующая NVIDIA CUDA, в будущем же вполне вероятно появление некоего общего стандарта для универсальных вычислений через Интернет. Если Khronos Group возьмётся за задачу, мы, возможно, в скором времени увидим новую аббревиатуру: WebCL.