Новости про GPGPU

AMD хочет реализовать DLSS через DirectML

Одной из главных особенностей GPU Turing от NVIDIA, наряду с трассировкой лучей, стало наличие ядер Tensor, которые используются для различных технологий на базе искусственного интеллекта, в частности, сглаживания.

Это сглаживание DLSS даёт весьма неплохой результат, практически не влияя на производительность. В недавнем интервью менеджер AMD по маркетингу продуктов GPU Адам Козак заявил, что компания ведёт эксперименты с расширенной версией Microsoft DirectML, чтобы получить эффект, подобный DLSS.

При этом Radeon VII демонстрирует превосходный результат. По мнению Козака, это значит, что эффекта DLSS можно достичь посредством функций GPGPU.

Менеджер по маркетингу продуктов AMD GPU Адам Козак
Менеджер по маркетингу продуктов AMD GPU Адам Козак

Он сообщил, что «пока радоваться рано, поскольку AMD лишь экспериментирует с DirectML. Пока это теоретические работы, но они могут быть реализованы на практике довольно быстро. Козак добавил, что новый функционал сглаживания стоит ожидать уже в декабре, вместе с новой версией драйвера Adrenalin, а если всё получится на Navi — то даже раньше».

Кроме DLSS Козак также рассказал, что в тестах трассировки, основанных на открытом исходном коде, Radeon VII значительно обошла GeForce RTX 2080. Он отметил, что именно открытые тесты стали одной из причин преимущества AMD, тем не менее, в OpenCL бенчмарке Luxmark будущий 7 нм GPU показал на 62% большую производительность, чем RTX 2080 в рендере трассировки лучей на базе GPGPU.

Энтузиасты создают открытый аналог CUDA

Разработчик GitHub с ником jgbit открыл проект с открытым исходным кодом, который назвал VUDA.

Идея этого проекта заключается в реализации аналога API NVIDIA CUDA, простого интерфейса для GPU вычислений, в мире свободного ПО.

Vulkan API
Vulkan API

Система VUDA работает поверх уже набравшего популярность графического API Vulkan, который обеспечивает доступ к аппаратному обеспечению на низком уровне. VUDA является библиотекой C++, что означает совместимость со всеми платформами, которые имеют компилятор C++ и поддерживают Vulkan.

Пример кода для VUDA
Пример кода для VUDA

Пока проект находится на начальном этапе, но его потенциал трудно представить, особенно, учитывая открытую лицензию. На GitHub приведен простой пример использования библиотеки, который может стать хорошим началом для будущих разработок.

Intel будет использовать встроенную графику для выявления зловредов

Компания Intel дополнила технологии Accelerated Memory Scanning и Advanced Platform Telemetry двумя новыми средствами для противостояния вредоносному ПО на аппаратном уровне.

Теперь система Accelerated Memory Scanning будет выгружать выявление атак на основе памяти на встроенную графику CPU. Согласно внутренним тестам компании, нагрузка методом GPGPU позволила снизить использование CPU с 20% до 2%.

Скан вредоносного кода
Скан вредоносного кода

Вторая техника объединяет отслеживание и облачное машинное обучение для выявления более совершенных угроз. Когда вредоносный код размещается на жёстком диске, он может быть замаскирован или даже зашифрован. Теоретически, когда он попадает в память, его становится легче выявить.

Процесс сканирования памяти на признаки вредоносного кода обслуживается драйвером Intel и работает в так называемой цепи приложений или Ring 3. Однако возможности данного решения могут быть расширены до уровня ядра, или Ring 0. Интенсивность сканирования может быть настроена для загрузки GPU. Однако если пользователь играет в игру, сканирование может быть отложено или размещено на других незагруженных ядрах GPU.

AMD представила Vega Cube производительностью 100 терафлопс

Компания AMD не осталась в стороне современных технологических тенденций и решила присоединиться к растущему рынку систем искусственного интеллекта.

В сети появились фотографии, на которых Раджа Кодури, глава Radeon Technologies Group, держит устройство, названное Vega cube (или Куб Кодури), состоящее из 4 прототипов ускорителей на базе GPU Vega. Эти снимки были сделаны на секретном мероприятии, посвящённом новому GPU и прошедшем на прошлой неделе.

Куб Кодури

Похоже, что представлен был лишь макет суперкомпьютерного модуля. О нём сейчас очень мало информации. По данным VideoCardz этот куб будет обладать производительностью в 100 терафлопс (FP16) и будет предназначен для систем глубокого обучения. Пока неизвестно, имеет ли AMD планы по выпуску устройства. Как известно, ранее фирма уже анонсировала подобное решение Project Quantum, которое так и не было реализовано.

Как нетрудно догадаться, AMD не представила никаких сведений об устройстве. Возможно, что AMD решила ответить на технологию NVLink от NVIDIA, однако в отличие от Tesla P100, Куб будет установлен вертикально.

Компания Finalwire обновила AIDA64 до версии 5.75

Компания FinalWire Ltd. выпустила минорное обновление релизной версии своей популярной диагностической и тестовой утилиты AIDA64.

В представленной версии набора утилит добавлена поддержка новейшего аппаратного обеспечения, включая видеопроцессоры NVIDIA Pascal и AMD Polaris. Кроме того, обновления коснулись и тестов для новых центральных процессоров Intel Kaby Lake, а также для новейших технологий GPGPU рассчётов от AMD и NVIDIA.

AIDA 64

Полный перечень изменений приведён ниже:

  • Добавлен 64-битный бенчмарк AVX2 и FMA для процессоров Intel Kaby Lake и Broadwell-E/EN/EP/EX.
  • Добавлена поддержка Microsoft Windows 10 Redstone RS1 Insider Preview.
  • Улучшена поддержка процессора AMD Zen Summit Ridge.
  • Добавлена поддержка датчиков AquaStream Ultimate и NZXT GRID+ V2.
  • Улучшена поддержка датчика Corsair Link.
  • Добавлена поддержка SSD Kingston SSDNow UV400.
  • Добавлена предварительная поддержка видеокарт AMD Radeon RX 470 и Radeon RX 480.
  • Добавлена детальная информация для видеокарт NVIDIA GeForce GTX 1070, GeForce GTX 1080, Tesla P100.
AIDA64 v5.75, доступна в трёх редакциях: Extreme и Business, а также Extreme Engineer для инженеров с разрешением использовать на неограниченном количестве ПК, приобрести которые можно в онлайн-магазине AIDA64.

NVIDIA предсказывает общедоступность суперкомпьютеров

В ходе недавней конференции в Остине, штат Техас, исполнительный директор NVIDIA Дзень-Хсунь Хуан рассказал, что видит широкие возможности для распространения суперкомпьютеров во многих отраслях промышленности.

Хуан пояснил, что суперкомпьютерные технологии хорошо продвигаются за пределы традиционных суперкомпьютерных систем, и технологии GPU станут частью будущих технологий, таких как автономные транспортные средства и персональные роботизированные помощники. Компания NVIDIA уже активно работает в этих отраслях, предложив автомобильный компьютер NVIDIA Drive PX и модуль машинного обучения Jetson TX1.

Супркомпьютеры везде

За последние пару лет графические процессоры нашли своё применение во многих суперкомпьютерах. По словам NVIDIA, использование GPU акселераторов в списке top500 суперкомпьютеров растёт ежегодно на 50%, а графический процессор Tesla использован в 23 из 24 новых суперкомпьютерах с GPGPU ускорением.

Количество ускоренных суперкомпьютеров

В будущем машинное обучение увеличит спрос на GPU ещё больше. Машинное обучение является «первоочередным применением высокопроизводительных вычислений для потребителей» — отметил Хуан. «Технология позволит технологии стать автономной в сложности реального мира и станет инструментом для производства автономных транспортных средств и машин, подобных персональным роботам-помощникам».

AMD нацеливается на профессиональную графику

Согласно презентации в ходе Computex, предназначавшейся для ограниченной публики, но опубликованной WCCFtech, компания AMD планирует увеличить инвестиции в профессиональное пространство GPU.

Представленная презентация показывает, что компания AMD решила уделить больше внимания продуктам FirePro и GPGPU. Продвижение профессиональной графики от AMD началось довольно неплохо, компании удалось занять большую часть рынка благодаря одному из самых успешных своих партнёров — компании Apple с компьютерами Mac Pro.

Что ещё примечательно, компания AMD планирует усилить свои позиции в области маркетинга и программного обеспечения, а не аппаратного обеспечения. Для продвижения марки FirePro главным брендом была выбрана Sapphire, а для успешного ведения этого направления компания готова тратить дополнительные средства, сообщает WCCFtech.

AMD FirePro

Кроме продвижения профессиональных графических решений, компания также решила усилить свои позиции в области центров обработки данных благодаря MXM модулям, разработанным специально для блейд серверов. Первый такой продукт получил номер модели S4000X. Сама же компания будет рекламировать его как «графику FirePro для ЦОД». Этот ускоритель расчётов будет иметь производительность в 992 Гфлопса обычной точности при энергопотреблении 45 Вт.

В долгосрочной перспективе AMD планирует обеспечить своими GPU серверы и MXM платы. Компания возлагает большие надежды на свои относительно мощные серверные процессоры с гетерогенной структурой, названные Berlin и Seattle.

AMD представляет FirePro W9100

Компания Advanced Micro Devices выпустила свою новую флагманскую профессиональную карту под названием Firepro W9100.

Последнее решение семейства профессиональных видеокарт компании нацелено на удовлетворение растущего рынка GPGPU расчётов и создания контента. Новая карта основана на GPU Hawaii и является первой в промышленности картой с 16 ГБ видеопамяти GDDR5 с пропускной способностью 320 Гб/с.

Видеоускоритель может похвастать предельно высокой производительностью, которая составляет 2 терафлопса при вычислениях с двойной точностью.

AMD FirePro W9100

Представленный ускоритель основан на полностью разблокированном GPU Hawaii, который содержит 2816 потоковых процессоров, 176 TMU и 64 ROP. Кроме инженерных и GPGPU расчётов W9100 прекрасно подходит для профессионалов в области видеообработки, поскольку использует OpenCL ускорения, а производительности карты достаточно для обработки 4K видео в реальном времени.

Видеокарта Firepro W9100 пока ещё не поступила в продажу, сейчас компания лишь провела официальную презентацию платы, представив технические характеристики устройства.

Утилита HWiNFO обновилась до версии 4.32

Словацкая утилита HWiNFO32/64 — это одна из старейших и мощнейших утилит по получению информации о системе, её диагностирования и мониторинга в реальном режиме времени.

Программа позволяют получать сведения о системе, а диагностическая часть поддерживает самые свежие компоненты, промышленные технологии и стандарты. Эти инструменты нацелены на распознавание и извлечение всей возможной информации об аппаратном обеспечении компьютера, что делает утилиты подходящими для пользователей, ищущих драйвера, производителей компьютеров, системных интеграторов и технических экспертов.

HWiNFO

В новой версии основное усилие разработчиков было направлено на исправление показаний датчиков материнских плат. Также была расширена база данных программы, в которой появились и уточнились сведения об интегрированных GPU и платах GPGPU.

Полный перечень изменений приведен ниже:

  • Исправлен отчёт с предупреждением о диске на некоторых SSD.
  • Добавлены NVIDIA Tesla K40m, K40st, K40s.
  • Улучшен мониторинг датчиков на материнских платах MSI серии 8.
  • Исправлен датчик на CPU Intel Haswell-U/Y.
  • Улучшено распознавание CHiL CHL8318/CHL8266 на GPU.
  • Улучшен мониторинг датчиков на MSI NF750-G55.
  • Исправлено сообщения о показаниях датчиков на GPU AMD после отключения питания.
  • Исправлена нумерация поздних AMD DGPU.
  • Исправлен мониторинг датчиков на ASUS MAXIMUS VI.
  • Добавлен мониторинг TSOD на SNB/IVB/HSW/BDW-E/EN/EP/EX.
  • Исправлен выбор размера шрифта для LG LCD.
  • Исправлены сообщения о частотах GPU на Haswell GT1.5.
  • Добавлена поддержка ITE IT8620E HW monitor.
  • Улучшен мониторинг датчиков на GIGABYTE серии A88X.

Нужной вам разрядности (32 или 64 бита) утилиту можно загрузить с официального ресурса. Как и раньше, программа HWiNFO32/64 беспроблемно работает на всех версиях ОС Windows от XP до 8.1, и, как и прежде, она совершенно бесплатна.

NVIDIA представила ускоритель Tesla K40

В ходе конференции SC13 компания NVIDIA представила самый производительный в мире видеоускоритель Tesla K40, сделав это вслед за AMD Firepro S10000 12 GB.

Как и положено ускорителям Tesla, он предназначен для суперкомпьютеров и он на целых 40% превышает по производительности Tesla K20X. Кроме того, этот ускоритель в 10 раз быстрее самого быстрого на сегодня CPU. Таким образом, ускоритель Firepro S10000 12 GB пробыл на вершине всего несколько дней.

«GPU ускорители стали мейнстрим продуктом в высокопроизводительных ПК и суперкомпьютерах, позволяя инженерам и учёным создавать новшества и делать научные открытия», — заявил Сумит Гупта, главный менеджер NVIDIA по продуктам ускоренных вычислений.

Tesla K40

Что касается аппаратной части, то K40 получил 2880 ядер CUDA с базовой частотой 745 МГц и до 875 МГц в режиме Boost, в то время как прошлое поколение, K20X, имело 2688 ядер частотой 732 МГц. В новой плате также используется более быстрая память GDDR5 частотой 3 ГГц, объём которой также как и противоборствующего лагеря составляет 12 ГБ.

В пресс-релизе компания указала, что  «ускоритель Tesla K40 обходит остальные ускорители по двум главным показателям вычислительной производительности: 4,29 терафлопса с обычной точностью и 1,43 терафлопса пиковой производительности с двойной точностью». Надо сказать, что это не совсем правда, поскольку AMD удалось сделать свой ускоритель с производительностью в 1,48 терафлопса при двойной точности вычислений.

Несмотря на недавний анонс, у NVIDIA уже есть первый клиент на новые платы. Им стал Техасский современный вычислительный центр в Остине, который планирует запустить новую интерактивную систему удалённой визуализации и анализа данных, под именем Maverick, уже в январе будущего года.