Новости про GPGPU и графические процессоры

NVIDIA скоро изготовит мультичиповый GPU Hopper

В Сети появились слухи, что в скором времени NVIDIA изготовит новый GPU под именем Hopper. Тут важно отметить, что это не игровое решение, и вы не увидите карту GeForce RTX 4080 Ti на его основе. Тем не менее, это инновационное решение.

В Twitter, в аккаунте Greymon55, появилось шифрованное сообщение с аббревиатурой «NHWTOS», которая через пару часов была расшифрована. Она гласит «NVIDIA's Hopper Will Tape Out Soon», то есть «NVIDIA Hopper скоро будет отпечатан».

Эта новая архитектура примечательна тем, что в ней используется мультичиповый модуль, вместо традиционного монолитного. И хотя этот процессор предназначен для суперкомпьютеров, нам он интересен по причине того, что его опыт может быть применён на поколении Lovelace или даже обновлённой версии Ampere, который планируются в 2024 и 2022 годах соответственно.

Переход от монолитной структуры GPU к мультичиповой

Мультичиповая технология в Hopper аналогична той, что использует AMD в своих центральных процессорах Zen и графических процессорах RDNA. Она изготавливает свои процессоры на TSMC, и новый чип NVIDIA также должен быть изготовлен на TSMC по 5 нм нормам. Ожидается, что чиплет из двух ядер GPU предложит в сумме 288 потоковых мультипроцессоров, что в 2,6 раза больше, чем у GPU NVIDIA A100. Кроме того, Hopper будет более энергоэффективным, чем Ampere. Считается, что его энергетическая эффективность вырастет в 3 раза.

Как обычно, к подобным слухам следует относиться с большой осторожностью и скептицизмом. Тем более, что они получены из неизвестных источников.

Первый китайский 7 нм GPU поступил в массовое производство

Компания Shanghai Tianshu Intellectual Semiconductor Co. (Tianshu Zhixin) объявила о том, что вплотную приблизилась к началу «массового производства и поставке» ускорителя Big Island, первого собственного графического ускорителя, изготовленного по 7 нм нормам.

В январе компания сообщала, что ускоритель BI, предназначенный не для игр, а для расчётов, будет производиться по неустановленному 7 нм техпроцессу в пакете CoWoS. Теперь Tianshu Zhixin официально подтвердила, что речь идёт о TSMC и технологии FinFET.

Ускоритель расчётов Big Island

Что касается спецификаций BI и его возможностей, то разработчики отметили, что он обладает «почти вдвое большей производительностью, по сравнению с продукцией основных изготовителей» при меньшем энергопотреблении и более привлекательном соотношении цена/производительность. Правда, цена пока не называется. Равно как и не сообщается о сроках поставки, как не ясно и то, будет ли продукт доступен по всему миру или только в Китае.

Спецификации ускорителя BI

По всей видимости, Tianshu Zhixin столкнулась с той же проблемой, что и все остальные технологические компании — дефицитом производственных мощностей.

Карта расширения Big Island

Intel будет использовать встроенную графику для выявления зловредов

Компания Intel дополнила технологии Accelerated Memory Scanning и Advanced Platform Telemetry двумя новыми средствами для противостояния вредоносному ПО на аппаратном уровне.

Теперь система Accelerated Memory Scanning будет выгружать выявление атак на основе памяти на встроенную графику CPU. Согласно внутренним тестам компании, нагрузка методом GPGPU позволила снизить использование CPU с 20% до 2%.

Скан вредоносного кода

Вторая техника объединяет отслеживание и облачное машинное обучение для выявления более совершенных угроз. Когда вредоносный код размещается на жёстком диске, он может быть замаскирован или даже зашифрован. Теоретически, когда он попадает в память, его становится легче выявить.

Процесс сканирования памяти на признаки вредоносного кода обслуживается драйвером Intel и работает в так называемой цепи приложений или Ring 3. Однако возможности данного решения могут быть расширены до уровня ядра, или Ring 0. Интенсивность сканирования может быть настроена для загрузки GPU. Однако если пользователь играет в игру, сканирование может быть отложено или размещено на других незагруженных ядрах GPU.

AMD нацеливается на профессиональную графику

Согласно презентации в ходе Computex, предназначавшейся для ограниченной публики, но опубликованной WCCFtech, компания AMD планирует увеличить инвестиции в профессиональное пространство GPU.

Представленная презентация показывает, что компания AMD решила уделить больше внимания продуктам FirePro и GPGPU. Продвижение профессиональной графики от AMD началось довольно неплохо, компании удалось занять большую часть рынка благодаря одному из самых успешных своих партнёров — компании Apple с компьютерами Mac Pro.

Что ещё примечательно, компания AMD планирует усилить свои позиции в области маркетинга и программного обеспечения, а не аппаратного обеспечения. Для продвижения марки FirePro главным брендом была выбрана Sapphire, а для успешного ведения этого направления компания готова тратить дополнительные средства, сообщает WCCFtech.

Кроме продвижения профессиональных графических решений, компания также решила усилить свои позиции в области центров обработки данных благодаря MXM модулям, разработанным специально для блейд серверов. Первый такой продукт получил номер модели S4000X. Сама же компания будет рекламировать его как «графику FirePro для ЦОД». Этот ускоритель расчётов будет иметь производительность в 992 Гфлопса обычной точности при энергопотреблении 45 Вт.

В долгосрочной перспективе AMD планирует обеспечить своими GPU серверы и MXM платы. Компания возлагает большие надежды на свои относительно мощные серверные процессоры с гетерогенной структурой, названные Berlin и Seattle.

Утилита HWiNFO обновилась до версии 4.32

Словацкая утилита HWiNFO32/64 — это одна из старейших и мощнейших утилит по получению информации о системе, её диагностирования и мониторинга в реальном режиме времени.

Программа позволяют получать сведения о системе, а диагностическая часть поддерживает самые свежие компоненты, промышленные технологии и стандарты. Эти инструменты нацелены на распознавание и извлечение всей возможной информации об аппаратном обеспечении компьютера, что делает утилиты подходящими для пользователей, ищущих драйвера, производителей компьютеров, системных интеграторов и технических экспертов.

В новой версии основное усилие разработчиков было направлено на исправление показаний датчиков материнских плат. Также была расширена база данных программы, в которой появились и уточнились сведения об интегрированных GPU и платах GPGPU.

Полный перечень изменений приведен ниже:

  • Исправлен отчёт с предупреждением о диске на некоторых SSD.
  • Добавлены NVIDIA Tesla K40m, K40st, K40s.
  • Улучшен мониторинг датчиков на материнских платах MSI серии 8.
  • Исправлен датчик на CPU Intel Haswell-U/Y.
  • Улучшено распознавание CHiL CHL8318/CHL8266 на GPU.
  • Улучшен мониторинг датчиков на MSI NF750-G55.
  • Исправлено сообщения о показаниях датчиков на GPU AMD после отключения питания.
  • Исправлена нумерация поздних AMD DGPU.
  • Исправлен мониторинг датчиков на ASUS MAXIMUS VI.
  • Добавлен мониторинг TSOD на SNB/IVB/HSW/BDW-E/EN/EP/EX.
  • Исправлен выбор размера шрифта для LG LCD.
  • Исправлены сообщения о частотах GPU на Haswell GT1.5.
  • Добавлена поддержка ITE IT8620E HW monitor.
  • Улучшен мониторинг датчиков на GIGABYTE серии A88X.

Нужной вам разрядности (32 или 64 бита) утилиту можно загрузить с официального ресурса. Как и раньше, программа HWiNFO32/64 беспроблемно работает на всех версиях ОС Windows от XP до 8.1, и, как и прежде, она совершенно бесплатна.

NVIDIA представила ускоритель Tesla K40

В ходе конференции SC13 компания NVIDIA представила самый производительный в мире видеоускоритель Tesla K40, сделав это вслед за AMD Firepro S10000 12 GB.

Как и положено ускорителям Tesla, он предназначен для суперкомпьютеров и он на целых 40% превышает по производительности Tesla K20X. Кроме того, этот ускоритель в 10 раз быстрее самого быстрого на сегодня CPU. Таким образом, ускоритель Firepro S10000 12 GB пробыл на вершине всего несколько дней.

«GPU ускорители стали мейнстрим продуктом в высокопроизводительных ПК и суперкомпьютерах, позволяя инженерам и учёным создавать новшества и делать научные открытия», — заявил Сумит Гупта, главный менеджер NVIDIA по продуктам ускоренных вычислений.

Что касается аппаратной части, то K40 получил 2880 ядер CUDA с базовой частотой 745 МГц и до 875 МГц в режиме Boost, в то время как прошлое поколение, K20X, имело 2688 ядер частотой 732 МГц. В новой плате также используется более быстрая память GDDR5 частотой 3 ГГц, объём которой также как и противоборствующего лагеря составляет 12 ГБ.

В пресс-релизе компания указала, что  «ускоритель Tesla K40 обходит остальные ускорители по двум главным показателям вычислительной производительности: 4,29 терафлопса с обычной точностью и 1,43 терафлопса пиковой производительности с двойной точностью». Надо сказать, что это не совсем правда, поскольку AMD удалось сделать свой ускоритель с производительностью в 1,48 терафлопса при двойной точности вычислений.

Несмотря на недавний анонс, у NVIDIA уже есть первый клиент на новые платы. Им стал Техасский современный вычислительный центр в Остине, который планирует запустить новую интерактивную систему удалённой визуализации и анализа данных, под именем Maverick, уже в январе будущего года.

AMD анонсирует первую серверную суперкомпьютерную видеокарту с памятью 12 ГБ

Компания AMD представила вниманию общественности свою видеокарту Firepro S10000, разработанную специально для высоких нагрузок большим объёмом данных, заявив, что это «первая в промышленности серверная суперкомпьютерная графическая карта».

Ускоритель Firepro S10000 12GB поддерживает в памяти GDDR5 технологии ECC и технологию DirectGMA, которая по словам компании позволит разработчикам работать с большими моделями и сборками, использовать возможности параллельных вычислений графических процессоров AMD, основанных на архитектуре Graphics Core Next.

Представленная плата нацелена на использование в серверах для визуализации в таких отраслях как проектирование и конструирование, геофизика, естественные науки, медицина и оборона. Кроме того, эта плата может быть использована с двойной и обычной точностью вычислений в генетических исследованиях, расчётах динамики жидкостей при сейсмических процессах, молекулярной динамике и, к примеру, спутниковой фотосъёмке.

Эту плату можно даже использовать в инженерных рабочих станциях хай-энд класса для повышения скорости работы 3D графики и GPGPU вычислений.

«Наши клиенты в области вычислений просили нас о решении, которое предложит увеличенный объём памяти для поддержки больших объёмов данных при создании ими новых продуктов и служб», — заявил старший директор AMD по профессиональной графике Дэвид Каммингс. «В ответ мы анонсировали графическую карту AMD Firepro S10000 12GB Edition, которая отвечает этим дополнительным требованиям к памяти, с поддержкой OpenCL и хай-энд вычислений и графических технологий».

Ускоритель AMD Firepro S10000 12GB может похвастать производительностью в 1,48 терафлопса двойной точности, что выше 1,31 терафлопса у NVIDIA Tesla K20X. Правда, TDP нового ускорителя AMD намного выше — 375 Вт против 235 Вт у Tesla K20.

Ожидается, что представленная видеокарта появится в продаже где-то в середине весны будущего года. Цена на плату пока не объявлялась. Этим шагом AMD пытается улучшить свои позиции на рынке суперкомпьютеров. В настоящее время среди самых быстрых 500 суперкомпьютеров в мире в 39 используется ускоритель расчётов NVIDIA, и лишь в трёх GPU от AMD.

Intel утверждает, что современные видеокарты NVIDIA всего лишь в 14 раз быстрее Core i7-960

Компания Intel на основе внутренних тестов сделала заявление, что её топовые процессоры всего лишь в 14 раз медленнее, чем видеокарты компании NVIDIA . Цель этого - опровергнуть заявления NVIDIA, что её графические процессоры превосходят процессоры Intel до 100 раз. 

В документе под названием "Debunking the 100x GPU vs CPU Myth"  Intel предполагает, что в некоторых случаях NVIDIA GeForce GTX 280 до 14 раз быстрее, чем Intel Core i7-960. Intel утверждает, что в среднем величина преимущества составляет 2,5 раза. Естественно, что NVIDIA тут же опубликовала опровержение этого.

В блоге, пресс-секретарь Andy Keane отметил, что Intel использовала не последнее поколение GPU от NVIDIA, правильнее было сравнивать с видеокартами семейства Fermi. Keane также отмечает, что Intel скорее всего запускала не оптимизированный код на GTX 280, и не понятно, как они сопоставили производительность GPU и центрального процессора.

Cотрудник NVIDIA признал, что не все приложения работают в 100 раз быстрее на GPU, но он привел в пример многих разработчиков, которые добились этого. По крайней мере, семь разработчиков заявили о преимуществе свыше 100 раз, и один заявил о цифре 300 раз.



Intel обращает внимание на вычисления средствами видеокарт

В прошедшую пятницу корпорация Intel публично заявила о том, что новое поколение её интегрированной графики будет поддерживать перекодирование видеопотоков. Тогда как шаг кажется незначительным, он может иметь глубокие последствия в индустрии, ведь Intel контролирует большую часть графического рынка.

По словам представителя Intel, новое поколение встроенной в процессоры Clarkdale графики будет поддерживать перекодирование видео графическим ядром. Несмотря на то, что изначально данная функция не поддерживается, она будет реализована обновлением драйвера.

Похоже, Intel впервые говорит о важности вычислений общего назначения средствами графических процессоров (GPGPU).

Intel Clarkdale — это 2-ядерный 32-нм процессор с 45-нм графическим ядром. Arrandale — это аналогичный мобильный процессор. Возможно, он также обзаведётся функцией кодирования видео. Выход этих новых чипов состоится, как ожидается, 7 января 2010 года, во время выставки потребительской электроники CES 2010.