Новости про GPGPU

NVIDIA предсказывает общедоступность суперкомпьютеров

В ходе недавней конференции в Остине, штат Техас, исполнительный директор NVIDIA Дзень-Хсунь Хуан рассказал, что видит широкие возможности для распространения суперкомпьютеров во многих отраслях промышленности.

Хуан пояснил, что суперкомпьютерные технологии хорошо продвигаются за пределы традиционных суперкомпьютерных систем, и технологии GPU станут частью будущих технологий, таких как автономные транспортные средства и персональные роботизированные помощники. Компания NVIDIA уже активно работает в этих отраслях, предложив автомобильный компьютер NVIDIA Drive PX и модуль машинного обучения Jetson TX1.

За последние пару лет графические процессоры нашли своё применение во многих суперкомпьютерах. По словам NVIDIA, использование GPU акселераторов в списке top500 суперкомпьютеров растёт ежегодно на 50%, а графический процессор Tesla использован в 23 из 24 новых суперкомпьютерах с GPGPU ускорением.

В будущем машинное обучение увеличит спрос на GPU ещё больше. Машинное обучение является «первоочередным применением высокопроизводительных вычислений для потребителей» — отметил Хуан. «Технология позволит технологии стать автономной в сложности реального мира и станет инструментом для производства автономных транспортных средств и машин, подобных персональным роботам-помощникам».

AMD нацеливается на профессиональную графику

Согласно презентации в ходе Computex, предназначавшейся для ограниченной публики, но опубликованной WCCFtech, компания AMD планирует увеличить инвестиции в профессиональное пространство GPU.

Представленная презентация показывает, что компания AMD решила уделить больше внимания продуктам FirePro и GPGPU. Продвижение профессиональной графики от AMD началось довольно неплохо, компании удалось занять большую часть рынка благодаря одному из самых успешных своих партнёров — компании Apple с компьютерами Mac Pro.

Что ещё примечательно, компания AMD планирует усилить свои позиции в области маркетинга и программного обеспечения, а не аппаратного обеспечения. Для продвижения марки FirePro главным брендом была выбрана Sapphire, а для успешного ведения этого направления компания готова тратить дополнительные средства, сообщает WCCFtech.

Кроме продвижения профессиональных графических решений, компания также решила усилить свои позиции в области центров обработки данных благодаря MXM модулям, разработанным специально для блейд серверов. Первый такой продукт получил номер модели S4000X. Сама же компания будет рекламировать его как «графику FirePro для ЦОД». Этот ускоритель расчётов будет иметь производительность в 992 Гфлопса обычной точности при энергопотреблении 45 Вт.

В долгосрочной перспективе AMD планирует обеспечить своими GPU серверы и MXM платы. Компания возлагает большие надежды на свои относительно мощные серверные процессоры с гетерогенной структурой, названные Berlin и Seattle.

AMD представляет FirePro W9100

Компания Advanced Micro Devices выпустила свою новую флагманскую профессиональную карту под названием Firepro W9100.

Последнее решение семейства профессиональных видеокарт компании нацелено на удовлетворение растущего рынка GPGPU расчётов и создания контента. Новая карта основана на GPU Hawaii и является первой в промышленности картой с 16 ГБ видеопамяти GDDR5 с пропускной способностью 320 Гб/с.

Видеоускоритель может похвастать предельно высокой производительностью, которая составляет 2 терафлопса при вычислениях с двойной точностью.

Представленный ускоритель основан на полностью разблокированном GPU Hawaii, который содержит 2816 потоковых процессоров, 176 TMU и 64 ROP. Кроме инженерных и GPGPU расчётов W9100 прекрасно подходит для профессионалов в области видеообработки, поскольку использует OpenCL ускорения, а производительности карты достаточно для обработки 4K видео в реальном времени.

Видеокарта Firepro W9100 пока ещё не поступила в продажу, сейчас компания лишь провела официальную презентацию платы, представив технические характеристики устройства.

Утилита HWiNFO обновилась до версии 4.32

Словацкая утилита HWiNFO32/64 — это одна из старейших и мощнейших утилит по получению информации о системе, её диагностирования и мониторинга в реальном режиме времени.

Программа позволяют получать сведения о системе, а диагностическая часть поддерживает самые свежие компоненты, промышленные технологии и стандарты. Эти инструменты нацелены на распознавание и извлечение всей возможной информации об аппаратном обеспечении компьютера, что делает утилиты подходящими для пользователей, ищущих драйвера, производителей компьютеров, системных интеграторов и технических экспертов.

В новой версии основное усилие разработчиков было направлено на исправление показаний датчиков материнских плат. Также была расширена база данных программы, в которой появились и уточнились сведения об интегрированных GPU и платах GPGPU.

Полный перечень изменений приведен ниже:

  • Исправлен отчёт с предупреждением о диске на некоторых SSD.
  • Добавлены NVIDIA Tesla K40m, K40st, K40s.
  • Улучшен мониторинг датчиков на материнских платах MSI серии 8.
  • Исправлен датчик на CPU Intel Haswell-U/Y.
  • Улучшено распознавание CHiL CHL8318/CHL8266 на GPU.
  • Улучшен мониторинг датчиков на MSI NF750-G55.
  • Исправлено сообщения о показаниях датчиков на GPU AMD после отключения питания.
  • Исправлена нумерация поздних AMD DGPU.
  • Исправлен мониторинг датчиков на ASUS MAXIMUS VI.
  • Добавлен мониторинг TSOD на SNB/IVB/HSW/BDW-E/EN/EP/EX.
  • Исправлен выбор размера шрифта для LG LCD.
  • Исправлены сообщения о частотах GPU на Haswell GT1.5.
  • Добавлена поддержка ITE IT8620E HW monitor.
  • Улучшен мониторинг датчиков на GIGABYTE серии A88X.

Нужной вам разрядности (32 или 64 бита) утилиту можно загрузить с официального ресурса. Как и раньше, программа HWiNFO32/64 беспроблемно работает на всех версиях ОС Windows от XP до 8.1, и, как и прежде, она совершенно бесплатна.

NVIDIA представила ускоритель Tesla K40

В ходе конференции SC13 компания NVIDIA представила самый производительный в мире видеоускоритель Tesla K40, сделав это вслед за AMD Firepro S10000 12 GB.

Как и положено ускорителям Tesla, он предназначен для суперкомпьютеров и он на целых 40% превышает по производительности Tesla K20X. Кроме того, этот ускоритель в 10 раз быстрее самого быстрого на сегодня CPU. Таким образом, ускоритель Firepro S10000 12 GB пробыл на вершине всего несколько дней.

«GPU ускорители стали мейнстрим продуктом в высокопроизводительных ПК и суперкомпьютерах, позволяя инженерам и учёным создавать новшества и делать научные открытия», — заявил Сумит Гупта, главный менеджер NVIDIA по продуктам ускоренных вычислений.

Что касается аппаратной части, то K40 получил 2880 ядер CUDA с базовой частотой 745 МГц и до 875 МГц в режиме Boost, в то время как прошлое поколение, K20X, имело 2688 ядер частотой 732 МГц. В новой плате также используется более быстрая память GDDR5 частотой 3 ГГц, объём которой также как и противоборствующего лагеря составляет 12 ГБ.

В пресс-релизе компания указала, что  «ускоритель Tesla K40 обходит остальные ускорители по двум главным показателям вычислительной производительности: 4,29 терафлопса с обычной точностью и 1,43 терафлопса пиковой производительности с двойной точностью». Надо сказать, что это не совсем правда, поскольку AMD удалось сделать свой ускоритель с производительностью в 1,48 терафлопса при двойной точности вычислений.

Несмотря на недавний анонс, у NVIDIA уже есть первый клиент на новые платы. Им стал Техасский современный вычислительный центр в Остине, который планирует запустить новую интерактивную систему удалённой визуализации и анализа данных, под именем Maverick, уже в январе будущего года.

AMD анонсирует первую серверную суперкомпьютерную видеокарту с памятью 12 ГБ

Компания AMD представила вниманию общественности свою видеокарту Firepro S10000, разработанную специально для высоких нагрузок большим объёмом данных, заявив, что это «первая в промышленности серверная суперкомпьютерная графическая карта».

Ускоритель Firepro S10000 12GB поддерживает в памяти GDDR5 технологии ECC и технологию DirectGMA, которая по словам компании позволит разработчикам работать с большими моделями и сборками, использовать возможности параллельных вычислений графических процессоров AMD, основанных на архитектуре Graphics Core Next.

Представленная плата нацелена на использование в серверах для визуализации в таких отраслях как проектирование и конструирование, геофизика, естественные науки, медицина и оборона. Кроме того, эта плата может быть использована с двойной и обычной точностью вычислений в генетических исследованиях, расчётах динамики жидкостей при сейсмических процессах, молекулярной динамике и, к примеру, спутниковой фотосъёмке.

Эту плату можно даже использовать в инженерных рабочих станциях хай-энд класса для повышения скорости работы 3D графики и GPGPU вычислений.

«Наши клиенты в области вычислений просили нас о решении, которое предложит увеличенный объём памяти для поддержки больших объёмов данных при создании ими новых продуктов и служб», — заявил старший директор AMD по профессиональной графике Дэвид Каммингс. «В ответ мы анонсировали графическую карту AMD Firepro S10000 12GB Edition, которая отвечает этим дополнительным требованиям к памяти, с поддержкой OpenCL и хай-энд вычислений и графических технологий».

Ускоритель AMD Firepro S10000 12GB может похвастать производительностью в 1,48 терафлопса двойной точности, что выше 1,31 терафлопса у NVIDIA Tesla K20X. Правда, TDP нового ускорителя AMD намного выше — 375 Вт против 235 Вт у Tesla K20.

Ожидается, что представленная видеокарта появится в продаже где-то в середине весны будущего года. Цена на плату пока не объявлялась. Этим шагом AMD пытается улучшить свои позиции на рынке суперкомпьютеров. В настоящее время среди самых быстрых 500 суперкомпьютеров в мире в 39 используется ускоритель расчётов NVIDIA, и лишь в трёх GPU от AMD.

Появились сведения о карте NVIDIA Tesla K40 Atlas

В Сети появились сведения о том, что компания NVIDIA готовит новый однопроцессорный компьютерный ускоритель модели Tesla K40 с кодовым именем Atlas.

Благодаря слайду NVIDIA, утекшему в Сеть и опубликованному китайским ресурсом ByCare, мы теперь можем знать его спецификации. Итак, карта будет основана на GPU GK180. Об этом чипе пока ничего неизвестно, но учитывая имеющийся слайд, он не слишком сильно отличается от GK110.

Процессор имеет 2880 ядер CUDA. Общая производительность ускорителя составит 4 Тфлопса при обычной точности и 1,4 Тфлопса при расчётах с двойной точностью. Также плата получит 12 ГБ памяти GDDR5, что вдвое больше, чем у Tesla K20X. Память будет иметь пропускную способность 288 ГБ/с. Также ускоритель должен иметь функцию динамического разгона, который работает в режимах ANSYS и AMBER. По сравнению с прошлым поколением, новый ускоритель будет работать с шиной PCI-Express 3.

Сообщается, что карта будет продаваться в двух версиях: в виде дополнительной карты и SXM. В зависимости от этого будет меняться и энергопотребление, которое составит 235 Вт или 245 Вт соответственно.

Rightware анонсировали бенчмарк Basemark CL

Компания Rightware представила утилиту тестирования производительности Open CL в многоядерных системах.

Представленный тест производительности предназначен в первую очередь для тестирования скорости работы производителями оборудования, полупроводниковыми компаниями и их партнёрами для проведения оптимизаций выполнения расчётов посредством OpenCL.

Тест Basemark CL производит нагрузку посредством выполнения OpenCL расчётов, которые очень похожи на типичные нагрузки. Именно по этой причине результат тестирования, выдаваемый этой программой, предельно объективен и релевантен. Язык OpenCL может быть крайне полезен для увеличения производительности в играх и пользовательском интерфейсе, а также улучшения их внешнего вида и реалистичности за счёт внедрения игровых элементов и анимации, основанной на физических эффектах.
Представленная версия программы Basemark CL нацелена на настольные компьютеры. Компания Rightware уверяет, что расширенная версия этого же теста будет опубликована несколько позднее.

Несмотря на состоявшийся анонс загрузить программу пока ещё невозможно.

NVDIA обещает 10% прирост производительности CUDA благодаря LLVM

Разработчик микропроцессоров, компания NVIDIA, обновила CUDA библиотеку базовых классов для объектно-ориентированного GPGPU программирования, включив в неё для увеличения производительности низкоуровневую виртуальную машину — low level virtual machine (LLVM).

В прошлом году компания объявила о значительных изменениях в их проприетарном программном фреймворке CUDA, а несколько дней назад выпустила первую версию изменения, которое включает компилятор LLVM. По утверждению NVIDIA, LLVM обеспечит «постоянное 10% ускорение в производительности приложений».

Кроме того, что NVIDIA теперь восхваляет мощь LLVM компилятора, фирма также предлагает виртуальный профилировщик, который поможет программистам оптимизировать их код. Суть в том, что программирование для GPGPU в большинстве случаев требует значительных оптимизаций, чтобы выжать каждую последнюю каплю скорости из GPU.

Кроме LLVM компания расширила библиотеку обработки сигналов. Обычно самостоятельный цифровой сигнальный процессор используется исследователями для симуляции определённых нагрузок, но с растущей библиотекой обработки сигналов некоторые нагрузки могут быть запущены на графической платформе NVIDIA с включённым CUDA.

Но пока NVIDIA наслаждалась популярностью CUDA в исследовательском сообществе, на горизонте появился серьёзный конкурент в лице OpenCL — открытого языка GPGPU вычислений. Тем не менее, NVIDIA утверждает, что им абсолютно безразлично какой именно язык используют программисты, до тех пор, пока они используют их графические платформы, продвигая CUDA в качестве отличного способа улучшения продаж GPU продуктов компании.

Бета-драйверы NVIDIA для Linux 270.26

С поддержкой GeForce GTX 560 Ti.

Новый бета-драйвер NVIDIA версии 270.26 для Linux содержит следующие изменения:

  • добавлена поддержка видеокарт GeForce GTX 560 Ti;
  • добавлена опция конфигурации X Interactive, отключение которой улучшает совместимость продолжительных GPGPU-вычислений с Х-интерфейсом;
  • исправлен ряд ошибок в реализации VDPAU.

Загрузить дистрибутивы можно по ссылкам ниже. Поддерживаются видеокарты GeForce и Quadro на базе NV40 и более новых архитектур.