Новости по теме «Новая версия OpenCl-Z»

Утекли данные о производительности флагманской Intel Arc 512EU

Компания Intel на днях сообщила, что ноутбучные версии графических ускорителей Intel Arc появятся уже в этом квартале, а затем, в следующей четверти, начнутся продажи ускорителей Arc среднего уровня для настольных ПК.

Очевидно, что ни первое поколение этих ускорителей Arc Alchemist, ни второе Arc Battlemage, не смогут конкурировать с лидерами рынка AMD и NVIDIA. Компания считает, что только ускорители третьего поколения Celestial смогут противостоять конкурентами.

Видеокарта Intel Arс 512EU

Тем не менее, это вовсе не означает, что Intel не станет выпускать топовые модели Alchemist. Лучшая видеокарта компании получит 512 исполнительных блоков или 32 ядра Xe. И вот в Сети появились первые результаты тестирования этой карты в Geekbench. Оказалось, что по крайней мере в тестах она показывает себя весьма неплохо. Так, в бенчмарке Geekbench 5 OpenCL она набрала 85 448 баллов, что примерно соответствует уровню GeForce RTX 2070 / 2060 SUPER и немного выше, чем у Radeon RX 6600 XT.

Тест производительности OpenCL видеокарты Arc 512EU

Важно отметить, что тест OpenCL не является лучшим показателем игровой производительности, однако он даёт неплохое понимание скорости работы GPU. Кроме того, тест проводился на центральном процессоре Core i5-9600K с памятью 2666 МТ/с, и, хотя тест OpenCL анализирует GPU, применение более быстрого процессора и памяти могут немного улучшить ситуацию.

GPU-Z обновилась до версии 2.17.0

Сайт TechPowerUp в очередной раз обновил свою популярную информационную и диагностическую утилиту.

Изменений оказалось довольно много. Самые главные из них — это расширение базы утилиты новыми видеокартами, как от NVIDIA, так и от AMD. В остальном же изменения касаются работы программы и исправления ошибок.

GPU-Z 2.17.0

Полный перечень изменений в GPU-Z 2.17.0:

  • Добавлена поддержка NVIDIA GTX 1660 Ti, Titan RTX, RTX 2080 Mobile, RTX 2070 Mobile, RTX 2060 Mobile, Quadro RTX 4000, GTX 650 (GK106), Quadro P5200.
  • Добавлена поддержка AMD Radeon VII, Radeon HD 8400E.
  • Добавлена поддержка Intel Amber Lake GT2 (Core i7-8500Y).
  • Добавлена поддержка определения версии Radeon Adrenalin 2019.
  • Упрощены имена некоторых сенсоров: «Частота GPU», «Частота памяти», «Частота шейдеров».
  • Унифицировано название сенсоров с «Использовано памяти / использование памяти» до «Использовано памяти».
  • Улучшена система отчёта о вылетах, которая задаёт уточняющие вопросы о проблеме.
  • Выпадающая Расширенная панель будет показывать «Тайминги памяти» только если информация об этом доступна.
  • «Максимальный размер пакета» OpenCL теперь отформатирован как неактивное значение.
  • Вместо пустого значения теперь отображается слово «отсутствует», когда нет поддерживаемых встроенных ядер OpenCL.
  • Добавлена поддержка «отсутствует» в OpenCL DP, SP, Half FP.
  • Исправлено «ошибка создания файла» при запуске GPU-Z.
  • Исправлен монитор загрузки GPU и памяти в RX 580 2048 SP.
  • Исправлены недостающие значения частоты Boost в GTX 1660 Ti и некоторых картах Pascal.
  • Исправлен недостающий сенсор вентилятора на картах RTX без подключённого монитора.
  • Исправлен вылет при запуске на Windows XP.
  • Исправлен вылет при открытии отчёта DXVA 2.0 на Windows XP.
  • Исправлен отчёт о лимитах энергопотребления на старых картах NVIDIA.
  • Исправлен вылет при сохранении BIOS на старых видеокартах NVIDIA.
  • Исправлен некорректный отчёт о VRAM на 16 ГБ Vega.
  • Исправлены вылеты по причине физического доступа к памяти. 

Загрузить утилиту GPU-Z можно на нашем сайте.

NVIDIA выпускает мобильные GPU серии MX200

В Сети появилось множество сведений о новых графических чипах NVIDIA для ноутбуков. Новая серия MX200 стала наследницей довольно популярной серии MX100.

Как и предшественница, новая серия GPU предназначена для ноутбуков среднего уровня и предлагает невысокую производительность для казуальных видеоигр, но при этом лучше, чем у интегрированных решений Intel и даже AMD.

Отмечается, что серия MX200, по отношению к предшественнице, не сильно изменилась. Так, в MX200 появилась поддержка GPUBoost 3.0, вместо 2.0, OpenGL 4.6 вместо 4.5 и OpenCL 1.2. Новая серия видеокарт основана на той же архитектуре Pascal, так что MX200 — это просто обновление прошлой линейки.

GPU NVIDIA MX250

По данным тестов самой NVIDIA, видеокарта MX230 имеет почти такую же производительность, как и MX130, а MX250 оказалась даже медленнее MX150. Это связывают со снижением частоты троттлинга в технологии GPU Boost 3.0.

В общем, новые GPU стали очередным небольшим улучшением для рынка ноутбуков, практически ничего не изменив в расстановке сил.

Khronos объединит OpenCL и Vulkan

В пресс-релизе анонса финальных спецификаций OpenCL 2.2 и SPIR-V 1.2, Khronos Group намекнула о возможной интеграции API OpenCL и Vulkan в будущем.

В оригинальном пресс-релизе лишь говорится о работе «консорциума над стремлением и развитием Khronos Vulkan API в объединении современной графики и вычислений в единый API».

Скотт Михауд из PC Perspective пояснил, что рабочая группа OpenCL приняла решение по согласованию своей дорожной карты с Vulkan, что станет основой для дальнейшего объединения этих API.

Несмотря на то, что и OpenCL и Vulkan работают на одном поле, первый API поддерживает более широкий спектр устройств, поддерживает бесплатный SYCL и кросс-платформенный абстрактный слой, который позволяет писать гетерогенный код по стандартам C++. В то же время Vulkan является маркетинговой звездой и обладает прекрасной поддержкой со стороны разработчиков.

Объединение OpenCL и Vulkan под эгидой Khronos станет прекрасным решением, которое позволит облегчить разработку приложений, распространить API на большее количество устройств и создать серьёзную конкуренцию DirectX 12.

Компания Finalwire обновила AIDA64 до версии 5.20

Компания FinalWire Ltd. анонсировала новую версию за номером 5.20 популярной диагностической и тестовой утилиты AIDA64.

В новой версии набора утилит появилась поддержка новых LCD устройств, внесены изменения в панель датчиков, добавлена поддержка новых процессоров Intel и AMD, а также видеокарт NVIDIA GeForce GTX 960 и GeForce GTX Titan X. Кроме того, были оптимизированы встроенные в AIDA64 бенчмарки.

Полный перечень изменений приведён ниже:

  • Оптимизирован 64-битный бенчмарк для APU Carrizo.
  • Добавлены бенчмарки с AVX2 и FMA ускорением для процессоров Broadwell.
  • Улучшена поддержка процессоров Intel Braswell, Broadwell-H, Cherry Trail и Skylake.
  • Добавлена предварительная поддержка APU AMD Nolan.
  • Добавлена поддержка датчиков жидкостных систем охлаждения AquaStream XT, MPS, PowerAdjust 2, PowerAdjust 3.
  • Добавлена поддержка датчиков блока питания Thermaltake DPS-G.
  • В панели датчиков появились столбчатые диаграммы (слева направо), управление статичными метками, измерение температуры с точностью 0,01 °С для желаемых датчиков.
  • Добавлена поддержка экранов Odospace LCD.
  • Добавлена поддержка CUDA 7.0, OpenCL 2.1.
  • Добавлена поддержка SSD Neutron XT, Crucial BX100, Crucial MX200, SanDisk Ultra II.
  • Добавлены детальные сведения о графических картах NVIDIA GeForce GTX 960, GeForce GTX Titan X.

AIDA64 v5.20, доступна в трёх редакциях: Extreme и Business, а также Extreme Engineer для инженеров с разрешением использовать на неограниченном количестве ПК, приобрести которые можно в онлайн-магазине AIDA64.

Обновилась популярная информационная утилита GPU-Z до версии 0.8.0

Сайт TechPowerUp подготовил очередное обновление своей популярной утилита GPU-Z, предназначенной для получения всей доступной информации о вашей видеокарте и мониторинга её параметров. Обновление получило номер 0.8.0.

В новой версии программы, GPU-Z получила возможность измерять использование памяти в Windows 8, в ней были исправлены ошибки подсчёта растровых модулей видеокарт и потоковых процессорах на ускорителях AMD.

Полный перечень изменений приведён ниже:

  • Добавлена полноценная поддержка GeForce GTX 970/980.
  • Исправлено сохранение BIOS для карт NVIDIA с GPU Maxwell.
  • Исправлен датчик используемой GPU памяти в Windows 8/8.1.
  • Исправлено зависание системы при воспроизведении на системах с GPU Hawaii.
  • Исправлены торможения CrossFire системы с активным ULPS.
  • Добавлена поддержка AMD Radeon R5 M240, R5 M255, FirePro W2100, W4100, W8100, FireStream 9270, FirePro 2450.
  • Добавлена поддержка NVIDIA Quadro K420, K620, K2000D, K2200, K4200, K5200.
  • Добавлена поддержка «забытых» вариантов мобильных GPU Haswell.
  • Добавлена предварительная поддержка GPU AMD Topaz.
  • Исправлен подсчёт ROP и шейдеров, размеров ядер, транзисторов, и названий продуктов для AMD Tonga.
  • Исправлено ошибочное определение HD 7990.
  • Исправлено определение OpenCL на некоторых картах ATI/AMD.
  • Добавлена поддержка датчиков PerfCap.

Загрузить эту бесплатную утилиту можно с нашего сайта или с сайта-разработчика программы.

Компания Finalwire обновила AIDA64 до версии 4.50

Сегодня компания FinalWire Ltd. анонсировала новую майскую версию за номером 4.50 популярной диагностической и тестовой утилиты AIDA64.

В новой версии набора утилит появился криптографический бенчмарк OpenCL, расширена база данных по новым платформам Intel, появилась поддержка памяти DDR4 и новых видеоускорителей.

Полный перечень изменений приведён ниже:

  • добавлен криптографический бенчмарк OpenCL GPGPU AES-256;
  • расширена диагностика графического акселератора AMD Mantle;
  • добавлена поддержка чипсетов Intel H97 и Z97;
  • улучшена поддержка процессоров Haswell-E и модулей памяти DDR4.
  • добавлена поддержка профилей памяти DDR4 XMP 2;
  • добавлена поддержка SSD A-Data SP;
  • детализирована информация для AMD Radeon R9 295X2 и FirePro W9100;
  • детализирована информация для NVIDIA GeForce GT 740, GeForce GTX Titan Z.

AIDA64 v4.50, доступна в трёх редакциях: Extreme и Business, а также Extreme Engineer для инженеров с разрешением использовать на неограниченном количестве ПК, приобрести которые можно в онлайн-магазине AIDA64.

AMD представляет FirePro W9100

Компания Advanced Micro Devices выпустила свою новую флагманскую профессиональную карту под названием Firepro W9100.

Последнее решение семейства профессиональных видеокарт компании нацелено на удовлетворение растущего рынка GPGPU расчётов и создания контента. Новая карта основана на GPU Hawaii и является первой в промышленности картой с 16 ГБ видеопамяти GDDR5 с пропускной способностью 320 Гб/с.

Видеоускоритель может похвастать предельно высокой производительностью, которая составляет 2 терафлопса при вычислениях с двойной точностью.

Представленный ускоритель основан на полностью разблокированном GPU Hawaii, который содержит 2816 потоковых процессоров, 176 TMU и 64 ROP. Кроме инженерных и GPGPU расчётов W9100 прекрасно подходит для профессионалов в области видеообработки, поскольку использует OpenCL ускорения, а производительности карты достаточно для обработки 4K видео в реальном времени.

Видеокарта Firepro W9100 пока ещё не поступила в продажу, сейчас компания лишь провела официальную презентацию платы, представив технические характеристики устройства.

Компания Finalwire обновила AIDA64 до версии 4.30

Два дня назад компания FinalWire Ltd. анонсировала новую мартовскую версию за номером 4.30 популярной диагностической и тестовой утилиты AIDA64.

Новая версия утилиты получила дальнейшее расширение многопоточных бенчмарков и возможности стресс-тестирования, которые теперь покрывают 128 логических процессоров и 2 группы процессоров, улучшена поддержка Microsoft Windows 8.1 и Windows Server 2012 R2, а также добавлены самые новые GPGPU технологии.

Полный перечень изменений приведен в списке ниже:

  • поддержка Microsoft Windows 8.1 Update 1 и Windows Server 2012 R2 Update 1;
  • OpenCL GPGPU бенчмарк хэша SHA-1;
  • поддержка CUDA 6.0;
  • поддержка материнских плат AM1;
  • улучшена поддержка Intel Broadwell;
  • добавлена предварительная поддержка APU AMD Carrizo и Toronto;
  • добавлена предварительная поддержка CPU Intel Skylake, Cherry Trail и Denverton;
  • добавлена поддержка SSD Crucial M550 и Intel 730;
  • уточнена информация о AMD Radeon R7 265;
  • уточнена информация о NVIDIA GeForce GTX 745 и серии GeForce 800.

AIDA64 v4.30, доступна в трёх редакциях: Extreme и Business, а также Extreme Engineer для инженеров с разрешением использовать на неограниченном количестве ПК, приобрести которые можно в онлайн-магазине AIDA64.

Встречайте: монстр для взлома паролей из 25 GPU

Исследователь и взломщик паролей с ником  @epixoip продемонстрировал взлом паролей с использованием 25 видеопроцессоров Radeon, использующих OpenCL.

Для управления всеми GPU использовалась технология под названием Virtual OpenCL или VCL. В случае если все видеокарты соединены между собой в сеть и все они используют OpenCL 1.1, то VCL позволяет управлять графическими процессорами. Непосредственно для взлома паролей применялась модифицированная версия инструмента oclHashCat.

Для демонстрации работы был использован кластер, состоящий из четырёх серверов:

  • Один сервер с 10 шт. Radeon HD 7970 (всего: 10 GPU);
  • Один сервер с 4 шт. Radeon HD 5970 (всего: 8 GPU);
  • Один сервер с 3 шт. Radeon HD 6990 (всего: 6 GPU);
  • Один сервер с 1 шт. Radeon HD 5870 (всего: 1 GPU).

Получившийся кластер обрабатывал 348 миллиардов NTLM хэшей паролей в секунду, а это значит, что любой 8-значный пароль (958 комбинаций) может быть подобран за 5,5 часов.

Rightware анонсировали бенчмарк Basemark CL

Компания Rightware представила утилиту тестирования производительности Open CL в многоядерных системах.

Представленный тест производительности предназначен в первую очередь для тестирования скорости работы производителями оборудования, полупроводниковыми компаниями и их партнёрами для проведения оптимизаций выполнения расчётов посредством OpenCL.

Тест Basemark CL производит нагрузку посредством выполнения OpenCL расчётов, которые очень похожи на типичные нагрузки. Именно по этой причине результат тестирования, выдаваемый этой программой, предельно объективен и релевантен. Язык OpenCL может быть крайне полезен для увеличения производительности в играх и пользовательском интерфейсе, а также улучшения их внешнего вида и реалистичности за счёт внедрения игровых элементов и анимации, основанной на физических эффектах.
Представленная версия программы Basemark CL нацелена на настольные компьютеры. Компания Rightware уверяет, что расширенная версия этого же теста будет опубликована несколько позднее.

Несмотря на состоявшийся анонс загрузить программу пока ещё невозможно.

WinZip 16.5 будет поддерживать OpenCL

Наверное, самым популярным форматом архивов для повседневного использования является zip, а программой для создания архивов и их распаковки — WinZip.

Сайт Geeks3D, ссылаясь на неназванные источники утверждает, что следующая версия этого популярного архиватора, которая получит номер 16.5, будет иметь аппаратное ускорение обработки на видеокартах посредством OpenCL. При этом OpenCL будет использоваться в WinZip 16.5 как для операций сжатия и декомпрессии, так и для выполнения AES шифрования.

Обновление WinZip должно быть представлено вместе с выпуском линейки видеокарт Radeon HD 7900, которая, как ожидается, будет показана в четверг 22 декабря.

Процессоры Ivy Bridge будут поддерживать технологии OpenCL

В процессоры Intel следующего поколения будет добавлена поддержка технологии OS X, предназначенной для ускорения работы игровых и финансовых приложений. Что означает гарантию более производительной работы MacBook Air в будущем.

«Обозначенная как технология „core“ OS X, OpenCL невероятно ускоряет приложения благодаря внедрению их в высокую вычислительную мощность графических процессоров», — говорится в отчёте Apple. Эти приложения внедряются в то, что на странице разработчиков Apple названо «удивительными параллельными вычислениями на GPU».

На самом деле, большая часть роста производительности нового процессора Intel (до 60% быстрее нынешних Sandy Bridge) обоснована улучшенным графическим ядром, на которое и пришлась основная часть изменений в структуре процессора.

Стоит отметить, что современные графические решения NVIDIA и AMD уже поддерживают OpenCL, однако они не используются в третьем поколении MacBook Air. Так что для получения ускорения этим лэптопам придётся дождаться обновления процессоров. По обновленным планам Intel производство процессоров нового поколения начнётся в первом квартале следующего года, так что обновление линейки ноутбуков Apple произойдёт не раньше чем через полгода.

Несмотря на добавления возможностей аппаратного ускорения OpenCL в процессоры Ivy Bridge, на данный момент нет никаких подтверждений того, что MacBook Air вообще получат чипы нового поколения. Но если это всё же произойдёт, то возникает другой вопрос. Процессоры Ivy Bridge поддерживают шину USB 3.0, и означает ли это, что обновленные MacBook получат в дополнение к Thunderbolt ещё и порты USB 3.0?

oclHashcat — взломщик паролей с использованием GPU

Забытый пароль вскоре может перестать быть проблемой. 

Развитие GPGPU-технологий осложнило жизнь системным администраторам и простым пользователям, заботящимся о защите своих данных: вскрытие пароля нормальной длины и сложности путём перебора, ранее считавшееся доступным лишь спецслужбам и группам хакеров, стало возможным почти для каждого — достаточно «натравить» на пароль современную видеокарту на базе логики AMD и NVIDIA. Программа oclHashcat, в отличие от специализированных GPGPU-утилит для вскрытия паролей баз данных и архивов RAR, является настоящим комбайном, умея подбирать хэши MD5, SHA1, NTLM, кэшированных паролей домена и паролей баз данных MySQL. Поддерживаются видеокарты как на базе AMD (OpenCL, требуется Catalyst 10.12 и ATI Stream SDK), так и NVIDIA (CUDA, требуется драйвер 260.хх и новее), программа работает в Windows и Linux.

Производительность перебора для современных карт составляет:

  • GeForce GTX 480: 1041 M c/s
  • GeForce GTX 580: 1217 M c/s
  • Radeon HD 5870: 1211 M c/s
  • Radeon HD 6970: 1575 M c/s

Интересно, что программа умеет использовать и несколько GPU одновременно в системах SLI/Crossfire (до 16, по заявлениям авторов). Будучи основанной на коде Hashcat, к программе могут подключаться словари аналогичного формата для дополнительного ускорения перебора. Лишь сложный консольный интерфейс отпугнёт желающих восстановить свой забытый пароль или узнать чужой.

В Bullet Physics 3 расширится использование GPU-ускорения для физики

Разработчики надеются выпустить к марту следующую версию открытого физического движка с поддержкой аппаратного ускорения на GPU.

Сотрудник AMD и по совместительству основной разработчик SDK для работы с физическими симуляциями Bullet Physics, Erwin Coumans, дал интервью сайту fxguide.com, в котором рассказал о состоянии и планах развития движка в рамках открытой физической инициативы AMD. Мы приводим выдержку высказываний и озвученных фактов из интервью:

  • Bullet Physics получил заметную популярность благодаря открытому исходному коду и достаточно свободной лицензии ZLib, в отличие от проприетарных решений вроде Havok и PhysX. Он также предлагает больше возможностей, чем другие открытые движки, вроде ODE.
  • В рамках открытой физической инициативы разработчики будут стараться создавать повторно используемые низкоуровневые компоненты, которые разработчики смогут интегрировать в собственные физические движки.
  • Bullet Physics помимо открытой версии имеет и закрытый компонент поддержки для платформы Sony Playstation 3 под названием «Physics Effects», и Sony продолжит его поддержку и в дальнейшем. В планы команды входит разработка поддержки платформы Xbox 360 и GPU-ускоряемой версии для API OpenCL и Microsoft Direct Compute.
  • Обработка физики столкновений в Bullet разбита на две основных фазы: фазу исключения несталкивающихся объектов из сцены и фазу точного расчёта точек столкновения объектов. Уже имеется реализация первой фазы с ускорением через OpenCL, но она имеет ограничения по размеру объектов.
  • Имеется множество способов ускорения вычислений физических симуляций, и хотя графические процессоры достаточно хороши для упрощённых расчётов, некоторые сложные алгоритмы, особенно с ветвлением, лучше выполняются на центральных процессорах. Оптимальным для физики будет совместное использование и центральных, и графических процессоров, что особенно перспективно для платформ Sandy Bridge и Fusion, где CPU и GPU практически слились в одно целое.
  • Релиз версии 3.х Bullet Physics намечен на март этого года и будет приурочен к очередной ежегодной конференции разработчиков игр (GDC). В новой версии ускорение через OpenCL и Direct Compute будет расширено на части общего физического конвейера, в дополнение к уже имеющемуся ускорению симуляций ткани.
  • Несмотря на нехватку ресурсов у разработчиков, Bullet Physics останется с открытым исходным кодом, и Erwin Coumans намерен не допустить привязок движка к проприетарным решениям кого-либо из производителей оборудования.

Bullet Physics был выбран в 2009 году AMD в качестве основы для открытой платформы GPU-ускоряемой игровой физики, в противовес закрытому решению GPU PhysX от NVIDIA. Осенью 2010 года сотрудничество дало плоды в виде первой публичной версии SDK 2.77 с поддержкой аппаратного ускорения, работающего для видеокарт всех производителей. Движок Bullet был также выбран Futuremark для тестов физики в составе бенчмарка 3DMark 11, сменив использовавшийся в 3DMark 2006 и 3DMark Vantage движок PhysX.

Intel поддерживает OpenCL

Последний гигант графического рынка присоединился к GPGPU-технологиям…но пока только на центральных процессорах.

Открытый стандарт универсальных вычислений на CPU, GPU и специальных процессорах вроде Cell, OpenCL был принят больше года назад. Серьёзными препятствиями на пути к его всеобщему признанию стали не только проблемы конкретных его реализаций у AMD и NVIDIA, но и неясность позиции третьего крупного игрока на рынке оборудования для вычислений и графики — компании Intel. Последняя неоднократно намекала на возможность неграфического применения своих интегрированных IGP, в основном в области ускорения операций с видео, но отказывалась сообщать что-либо конкретное о подходах к реализации данных функций своего оборудования для программистов. Перед конференцией SC 2010 произошла утечка сведений, что шейдерные ядра будущих IGP процессоров Sandy Bridge будут поддерживать GPGPU, и что в нёдрах Intel вызревает соответствующий SDK для OpenCL.

На днях без лишней помпы Intel представила предварительную версию OpenCL SDK. В неё реализована полная функциональность спецификаций OpenCL 1.1, в том числе:

  • поддержка внеочередного исполнения (out-of-order);
  • поддержка вещественных вычислений с двойной точностью;
  • работа с контекстом OpenCL из OpenGL-приложения, а также совместное использование буферов и памяти текстур между этими API;
  • архитектура ICD драйвера для одновременного присутствия нескольких реализаций OpenCL в системе.

Вместе с тем, имеется небольшой нюанс — на настоящий момент реализована только CPU Target, т. е. исполнение OpenCL с помощью x86 инструкций на центральном процессоре. Что и как будет с интегрированными графическими ядрами — пока чёткого ответа так и нет.

Загрузить SDK и сопроводительную документацию можно с сайта Intel. Для работы требуются Windows Vista или 7, 32- или 64-разрядная версия (но поддерживается работа лишь 32-разрядных OpenCL приложений), а также центральный процессор с поддержкой инструкций SSE 4.1 (то есть на ядре Nehalem или новее). В настоящее время работа поддержки OpenCL от Intel требует отключения других поставщиков OpenCL в системе с помощью правки реестра.

Будем надеяться, что Intel по-настоящему поддержит общий стандарт, тем более, что уже даже графические процессоры в телефонах и КПК в ближайшее время будут обладать такой возможностью.

ARM разработала графический процессор для мобильных решений с поддержкой GPGPU

Новое ядро Mali T604 предложит не только производительность графики, но и поддержку универсальных вычислений.

Компания ARM известна как разработчик экономичных процессоров для мобильных и встраиваемых компьютеров на базе одноимённой архитектуры, но также занимается и разработкой GPU линейки Mali для того же сегмента. Новый продукт компании, Mali T604, будет обеспечивать не только до пятикратного повышение производительности графики на мобильных устройствах в сравнении с предыдущим поколением Mali, но и ускорение вычислений общего характера посредством OpenCL 1.1.

Характеристики устройства достаточно внушительны для предполагаемой области применения:

  • от одного до четырёх шейдерных ядер;
  • 32 кб кэша L2 на ядро;
  • поддержка виртуальной видеопамяти;
  • поддержка FSAA 4x;
  • совместимость с OpenGL ES 2.0, Direct3D (версия не указана, но надо полагать, не ниже 9.0) и OpenCL 1.1.

Особенно подчёркивается полная поддержка OpenCL — благодаря новой архитектуре под обозначением Midgard исполнительные блоки Mali T604 полностью соответствуют IEEE 754-2008 и поддерживают выполнение до трёх операций параллельно:

Благодаря этому поддерживаются даже вещественные вычисления с двойной точностью и HDR-рендеринг.

Новую архитектуру уже лицензировала компания Samsung для своих мобильных решений. Так что у графических решений PowerVR SGX и NVIDIA Tegra в мобильном сегменте появился мощный конкурент. Одновременно ARM объявила о готовности к производству центральных процессоров линейки Cortex по 32 нм технологическому процессу, что позволит поднять рабочие частоты до 1,6 ГГц.

Следующая версия ArcSoft Total Media Theatre будет использовать OpenCL

GPGPU-технология ускорит операции с видео в пятой версии пакета.

В пятой версии мультимедиа «комбайна» Total Media Theatre от ArcSoft будет активно использоваться API универсальных вычислений OpenCL. Помощь во внедрении поддержки GPGPU-технологий для работы с видео компании ArcSoft окажет AMD.

OpenCL будет применён прежде всего в фирменном «улучшителе» видео SimHD, позволяющем делать масштабирование видео SD-качества до HD, осуществлять постобработку и конверсию частоты кадров видеопотока. Выполнение таких достаточно ресурсоёмких операций на GPU позволит разгрузить центральный процессор для других задач при воспроизведении видео. Также ArcSoft планирует переписать H.264 кодеки в составе своих продуктов для ускорения операций кодирования видео с помощью OpenCL.

Релиз TotalMedia Theatre 5 намечен на католическое рождество этого года, и, помимо поддержки OpenCL, принесёт улучшения воспроизведения Blu-Ray 3D, поддержку потокового видео из Интернет, поддержку формата MKV и переработанный интерфейс приложения.

Khronos Group выпустила спецификации OpenGL 4.1

Khronos Group представила обновленный вариант графического API (Application Programming Interface) OpenGL 2D и 3D , который при сохранении обратной совместимости обеспечивает дополнительные функциональные возможности, а также поддержку OpenGL ES 2.0 API.

Полный список дополнений в OpenGL 4.1 включает в себя:

  • полная совместимость с OpenGL ES 2.0 API для удобства переноса между настольными и мобильными платформами;
  • возможность запроса и загрузки бинарных объектов шейдерных программ для сохранения повторной компиляции;
  • cпособность связывать отдельные программы для программируемых этапов гибкого программирования;
  • 64-битная точность для числ с плавающей точкой в компонентах вершинных шейдеров и материалах для высокой геометрической точности;
  • несколько возможностей создания поверхностей для увеличения гибкости рендеринга;
  • новые ARB расширения;
  • синхронизация OpenGL-объектов с OpenCL-объектами для улучшения совместимости с OpenCL;
  • возможность установить шаблон значений фрагмента шейдеров для повышения гибкости рендеринга;
  • повышение надежности при запуске приложений WebGL;
  • новые механизмы получения расширенных ошибок и предупреждений.

Спецификации OpenGL 4.1 опубликованы и могут быть найдены на официальном сайте.

AMD предлагает инвестировать средства на поддержку разработчиков программ для архитектуры Fusion

AMD имеет большие планы на Fusion и планирует выделять инвестиции, направленные на создание прочной базы разработчиков.

В интервью PC World, директор AMD по продажам Fusion Джон Тейлор объявил о планах AMD по инвестированию в программное обеспечение для разработки приложений, предназначенных для нового поколения процессоров. Тейлор также отметил, что AMD будет вкладывать средства в компании, занимающиеся разработкой оборудования и комплектующих для поддержки архитектуры Fusion.

Тейлор отметил, что целью AMD является ускорение внедрения уникальных решений и вычислительных приложений, специально разработанных для использования комплексной архитектуроы Fusion. Он отметил, что графические процессоры могут, среди прочего, ускорять приложения рендеринга и обеспечивать безопасность браузеров.

Ранее AMD и NVIDIA поддержали усилия по использованию GPU при вычислениях. AMD оказывает помощь разработчикам OpenCL, а NVIDIA оказывает содействие развитию CUDA в течение многих лет.

Тейлор подтвердил, что AMD уже сделала некоторые, связанные с Fusion, стратегические инвестиции, но не раскрыл название компаний, принимающих участие в программе.

Подробнее вы можете прочитать на сайте pcworld.com (на английском).

Доступен для загрузки бета драйвер NVIDIA GeForce 258.69

NVIDIA выпустила бета драйвер GeForce 258.69 с массой изменений и увеличением производительности во многих играх. Этот пакет драйверов поддерживает настольные видеокарты GeForce серий 6/7/8/9/100/200/300/400, а также ION.

Новое в этой версии драйверов:

  • добавлена поддержка Blu-Ray с 3D технологией NVIDIA 3D Vision;
  • увеличена производительность серии GeForce GTX 400 в нескольких играх. Ниже приведены примеры некоторых из наиболее значительных улучшений, измеренные для GeForce GTX 480. Результаты будут варьироваться, в зависимости от графического процессора и конфигурации системы:
    • до 14% в Aliens vs. Predator (1920*1200 без AA/AF — тесселяция вкл.);
    • до 4% в Batman: Arkham Asylum (1920*1200 4xAA/16xAF PhysX = выс.);
    • до 5% в BattleForge (1920*1200 4xAA/16xAF — очень высокие настройки);
    • до 5% в Call Of Duty: Modern Warfare 2 (1920*1200 4xAA/16xAF);
    • до 4% в Crysis: Warhead (1920*1200 4xAA/16xAF — настройка для энтузиастов);
    • до 24% в Enemy Territory: Quake Wars (1920*1200 без AA/AF);
    • до 9% в Far Cry 2 (2560*1600 8xAA/16xAF);
    • до 25% в Just Cause 2 (2560*1600 без AA/AF — Concrete Jungle);
    • до 7% в Метро 2033 (1920*1200 без AA/16xAF — тесселяция вкл.);
    • до 40% в Метро 2033 на SLI ((1920*1200 4xAA/16xAF — тесселяция вкл.);
    • до 8% в STALKER: Зов Припяти (1920*1200 не AA/AF — день);
    • до 110% в Stone Giant на SLI (2650*1600 — тесселяция вкл, DoF вкл.);
    • до 6% в The Chronicles of Riddick: Dark Athena (2560*1600 без AA/AF);
    • до 9% в Unigine: Tropic (2560*1600 без AA/AFOpenGL);
    • до 5% в 3DMark Vantage (Extreme производительность);
    • до 19% с Transparency АА (1920*1200 4xTrSS — измеряется в Crysis);
  • добавлена поддержка OpenGL 4.0 для серии GeForce GTX 400;
  • добавлена поддержка CUDA Toolkit 3.1, который включает значительное увеличение производительности для двойной точности в математических операциях;
  • добавлена поддержка новых режимов сглаживания для 3-Way SLI, в том числе до SLI48x АА на GeForce серии 200, и до SLI96x AA для GeForce GTX 400 серии;
  • добавлена поддержка нового режим качества NVIDIA Ambient Occlusion в панели управления;
  • добавлена в панель управления NVIDIA новую страницу настройки SLI и PhysX для полного контроля над многопроцессорными графическими конфигурациями;
  • добавлены в панель управления NVIDIA новые функции для полного контроля над CUDA GPU, позволяя пользователю выбрать, как более эффективно использовать GPU для каждого приложения CUDA.

Дополнительная информация:

  • устанавливается HD Audio драйвер версии 1.0.10.1 (для поддерживаемых графических процессоров);
  • поддержка новых GPU-ускоренных функций Adobe CS5;
  • поддержка GPU-ускорения для более плавного онлайн видео в HD качестве с Adobe Flash 10.1;
  • поддержка новой версии видео MotionDSP в программном обеспечении vReveal, которое добавляет поддержку для вывода HD;
  • поддержка DirectCompute на Windows 7 и GeForce 8-серии и старше;
  • поддержка OpenCL 1.0 (Open Computing Language) для всех GeForce 8-серии и старше;
  • поддержка OpenGL 3.3 для GeForce 8-серии и старше;
  • поддержка одного GPU и технологии NVIDIA SLI в DirectX 9, DirectX 10, DirectX 11 и OpenGL, включая 3-Way SLI, Quad SLI и SLI на поддерживающих SLI, сертифицированных материнских платах на базе Intel X58;
  • поддержка разгона GPU и мониторинга температуры при установке программного обеспечения NVIDIA System Tools.

Скачать драйвер для 32-бит и для 64-бит систем Windows 7/Vista вы можете на официальном сайте.

Окончательные спецификации OpenCL 1.1

Один из лидеров в мире Open Source программирования, Khronos Group сегодня опубликовал спецификации OpenCL 1.1 — первое крупное обновление OpenCL, распространяемое бесплатно.

Версия OpenCL 1.1 добавляет значительные функциональные возможности для расширения возможностей параллельного программирования и привносит в создаваемые приложения больше гибкости, функциональности и производительности, в том числе засчет:

  • новые типы данных, в том числе 3-х компонентные вектора и дополнительные графические форматы;
  • обработка команд из нескольких хостов и использование буфера между несколькими устройствами;
  • операции по отдельным частям буфера в том числе чтение, запись и копирование 1D, 2D или 3D прямоугольных областей;
  • расширенное использование событий и систем управления командами;
  • дополнительные OpenCL C встроенные функции, такие как: integer clamp, shuffle и asynchronous strided copies;
  • улучшенная совместимость с OpenGL на основе эффективного обмена изображениями и буферами для связи OpenCL и OpenGL событий.

Напомню, в рабочую группу OpenCL входят такие известные компании, как: AMD, Apple, Blizzard Activision, Electronic Arts, Ericsson, IBM, Intel, Nokia, S3 Graphics, Sony, STMicroelectronics, Symbian, Texas Instruments и, конечно же, NVIDIA.

AMD GPU PerfStudio 2.2 и OpenCL-zone

Разработчики игр и GPGPU получают повышенное внимание со стороны AMD.

Продукт GPU PerfStudio от AMD призван решать те же задачи, что и средства NVIDIA PerfKit и Intel GPA — помочь разработчикам игр и графических приложений в отладке и оптимизации производительности. Средства отладки включают в себя подсчёт времени операций построения кадра, отслеживание загрузки отдельных узлов GPU по мере рендеринга и отладчик кода шейдеров. Большинство функций не зависит от используемого оборудования, важным преимуществом над PerfKit и GPA также является отсутствие необходимости изменения приложения для отладки в пакете и использования специальных «отладочных» драйверов видеокарты.

В новой версии 2.2 PerfStudio были сделаны следующие изменения:

  • более точное определение цвета пиксела в инструменте просмотра текстур;
  • поддержка связывания шейдеров в DirectX 11;
  • поддержка texture arrays в OpenGL;
  • улучшение совместимости с приложениями;
  • улучшения в интерфейсе клиента для удалённой отладки;
  • мелкие исправления и улучшения.

Загрузить пакет для Windows XP/Vista и 7 можно с официального сайта (~20 Мб).

Кроме того, AMD открыла специальный раздел сайта для разработчиков OpenCL Zone. Название недвусмысленно противопоставляет инициативу NVIDIA CUDA Zone, как и последняя, OpenCL Zone будет служить централизованным источником информации о GPGPU-технологиях и своего рода выставкой «достижений народного хозяйства» — приложений с использованием OpenCL. Правда, пока выставлять в соответствующем разделе особо нечего, в отличие от 1000+ приложений и примеров в CUDA Zone.

Презентации Khronos с GDC 2010

Не попавшие на Game Developers Conference в этом году могут посмотреть материалы в электронном виде.

Презентации Khronos Group можно загрузить с сайта группы по ссылкам ниже:

Напомним, что NVIDIA также опубликовала презентации с GDC 2010.

Swan — преобразователь программ CUDA в OpenCL

Инструмент для собирающихся переводить имеющиеся GPGPU программы с CUDA на OpenCL.

Консольное приложение Swan позволяет в среде Linux автоматически преобразовать исходный код ядра CUDA-программ в ядро OpenCL. Программа заменяет вызовы функций и создаёт новые точки входа. Также предлагается собственный «абстрактный» API, позволяющий создавать программы, равно легко конвертируемые с помощью Swan в CUDA или OpenCL.

Конечно, программа имеет множество ограничений, пока что не поддерживается работа с несколькими устройствами и конвертация для выполнения CUDA/OpenCL кода на CPU, как и использование возможностей C++ в исходном тексте CUDA-программы. Будем надеяться, что подобные экономящие время инструменты не останутся без развития, благо программа выпущена под GPL и исходный код доступен. Загрузить утилиту можно с официального сайта.