Новости про Tesla

NVIDIA ускоряет суперкомпьютер «Ломоносов»

САНТА-КЛАРА, Калифорния — 15 июня, 2011 — Российские ученые решили обратиться к суперкомпьютерам на базе GPU для решения научных задач, и сегодня Московский государственный университет имени М.В. Ломоносова оснащает свой суперкомпьютер «Ломоносов» графическими процессорами NVIDIA Tesla, благодаря чему он станет одной из самых быстрых вычислительных машин в мире.

Гибридное расширение «Ломоносова» состоит из 1554 графических процессоров NVIDIA Tesla X2070 и такого же числа четырехъядерных CPU, обеспечивая всю систему пиковой производительностью 1,3 петафлопс, что делает ее самым быстрым суперкомпьютером в России и одной из самых быстрых вычислительных систем в мире.

Суперкомпьютерные ресурсы МГУ используется в первую очередь для выполнения фундаментальных научных исследований, предполагающих ресурсоемкие вычисления. Среди таких задач масштабные работы по глобальному изменению климата и динамике мирового океана, постгеномной медицине, механизмам формирования галактик и др.

Суперкомпьютер "Ломоносов"

«Для наших исследований требуются огромные вычислительные ресурсы, и мы должны обеспечить необходимую производительность максимально эффективным способом»,— отметил Виктор Садовничий, академик РАН, ректор Московского государственного университета. «Единственно возможный способ добиться этих целей одновременно – использование гибридных вычислительных систем на базе GPU/CPU», добавил он.

Более подробно о новом расширении Tesla для суперкомпьютера «Ломоносов» можно прочесть на сайте NVIDIA.

Intel готовится выпустить ускорители с архитектурой Many Integrated Core в ближайшее время

Intel рассчитывает запустить первые Many Integrated Core (MIC) используя готовящийся к внедрению 22 нм техпроцесс, при этом планируется привлечь более 100 разработчиков для MIC до конца 2011 года.

Ожидается, что дополнительный акселератор микроархитектуры Intel MIC будет использоваться для сильно распараллеленных приложений в высокопроизводительных вычислениях, в таких сегментах как научные исследования и погодное моделирование. Но в отличие от AMD FireStream или NVIDIA Tesla, Intel хочет, чтобы их технология не заменила процессоры, а ускорила существующие приложения.

Дополнительный акселератор микроархитектуры Intel MIC

Intel настаивает, что х86-совместимость даст MIC уникальное преимущество. Кирк Скоген (Kirk Skaugen), вице-президент архитектурной группы и главный менеджер группы датацентра Intel, во время своего доклада на Intel Developer Forum сказал, что MIC будет, как бы, сопроцессором, на котором вы сможете использовать те же компиляторы, те же инструменты, тот же VTune. При этом вычислительная мощность составит порядка 90% самых производительных мировых компьютеров.

Он также пообещал, что когда вы запустите компилятор следующего поколения, он уже будет оптимально загружать ядра Intel, находящиеся в процессорах Xeon, и он будет оптимизировать загрузку на новых PCI Express картах, которые будут иметь более чем 50 ядер изготовленных по 22 нм технологии.

А пока Intel представила тестовую платформу под названием Knights Ferry, предназначенную для отбора разработчиков и планы по увеличению числа разработчиков, имеющих необходимое оборудование, до сотни, к концу 2011 года.

Суперкомпьютеры с процессорами NVIDIA возглавили Top-500

Три вооружённых чипами NVIDIA суперкомпьютера оккупировали верхние строчки списка.

Ноябрьский список Top500 принёс ожидаемое первое место китайскому суперкомпьютеру Tianhe-1A, 2,7 петафлопа которому обеспечили вычислительные модули NVIDIA Tesla. Однако, он оказался не единственным GPU-ускоренным суперкомпьютером в верхних строчках списка. На третьем месте расположился предтеча Tianhe-1A, суперкомпьютер Nebulae, также оснащённый модулями Tesla, c общей производительностью в 1,27 петафлоп. Четвёртое место занял еще один новичок в списке, суперкомпьютер Tsubame 2.0 из Японии, в результат которого в 1,19 петафлоп основной вклад внесли процессоры NVIDIA Tesla.

Продукты компании Cray Inc продолжают удерживать половину верхней десятки списка, но такими темпами перевес скоро окажется не на их стороне и количественно.

Tsubame 2.0 Tesla HPC

CPU против GPU: новый раунд

Плюс прогноз применимости GPGPU для суперкомпьютеров.

В этом году IBM публиковала два исследования, в которых сравнивалась производительность CPU и GPU в математических задачах. В первом случае центральный процессор IBM Power 7 опередил GeForce GTX 285, причём двухпроцессорная система на базе Intel Xeon показала лишь чуть меньший результат, во втором испытании модуль NVIDIA Tesla 2050 опередил всех соперников, но разрыв в производительности составил чуть более двухкратного для Power 7 и не дотянул до четырёхкратного над Xeon. И вот появилось новое исследование, от университетов Оксфорда и Ворвика, Великобритания, в котором системам на базе Xeon были противопоставлены модули Tesla разных поколений и пара «бытовых» видеокарт.

Xeon vs CUDA results

Хотя для исполнения на CUDA использованный тест NAS LU пришлось портировать с Fortran на C, результат представляет немалый интерес. Всего один четырёхъядерный процессор Xeon X5550, работающий на частоте 2,66 ГГц, смог показать лучший результат, чем GeForce 9800 GT с теоретической производительностью 500 GFLOPS. GeForce 8400 GS из-за ограниченного буфера памяти (256 Мб) смогла выполнить лишь один этап из трёх и показала ужасную производительность. Модули Tesla оправдали свою репутацию, но отрыв в производительности не превышал 10-кратного. Любопытно, что включение режима защиты памяти ECC на Tesla 2050 стоило ей 20 % производительности, в том числе из-за потери 16 % объема видеопамяти на контрольные суммы.

Британские учёные не могли хотя бы частично не подтвердить свою репутацию. На основе полученных данных они попытались спрогнозировать производительность суперкомпьютерных систем на базе Tesla, сравнив их предсказанную производительность с хорошо себя зарекомендовавшими системами BlueGene /P от IBM.

Tesla vs BlueGene preview

Согласно предсказанию, традиционный подход к построению суперкомпьютеров выиграет по соотношению фактической производительности на Ватт, и в конечном итоге — по быстродействию вообще. Впрочем, GPU уже сделали заявку на лидерство среди суперкомпьютеров, посмотрим, что сможет на неё ответить та же IBM.

Китайский суперкомпьютер Tianhe-1A достиг быстродействия в 2,5 петафлопс используя NVIDIA Tesla

Микросхемы от NVIDIA приводят в действие самый мощный на сегодняшний день суперкомпьютер.

Китайский суперкомпьютер «Tianhe-1A» достиг быстродействия в 2,507 петафлопс, используя 7168 чипов NVIDIA Tesla M2050 и 14336 процессоров Intel Xeon. Это выше предыдущего рекорда (который тоже, кстати, поставлен в Поднебесной) суперкомпьютера «Nebulae», где также использовались чипы NVIDIA Tesla, обеспечившие производительность в 1,271 петафлопс.

NVIDIA Tesla

Кроме того, по заявлению источника, представители NVIDIA заявили, что суперкомпьютер «Tianhe-1A» не только самый быстрый в мире, но и самый «зелёный», так как использует для своей работы всего лишь 4,04 мегаватта энергии. А это почти в 3 раза меньше для достижения аналогичной производительности при использовании в системе только CPU.

По заявлению менеджера по маркетингу чипа Tesla NVIDIA Sumit Gupta, приложения данного «open science project» будут использоваться для исследовательских работ в области астрофизики, биохимии и других прикладных наук.

Стоимость одних использованных карт Tesla для построения системы составила почти 18 миллионов долларов, но одна из самых мощных экономик мира легко может позволить себе такие затраты на фундаментальные научные исследования. Предположительно, «Tianhe-1A» займёт первую строчку в следующем выпуске рейтинга суперкомпьютеров TOP-500, скинув с пьедестала все суперкомпьютеры США и Европы.

Серверы Dell с готовностью к GPGPU и виртуализации

Модульный сервер позволяет установить до 16 GPU-карт PCI Express.

Компания Dell для своих новых серверов линейки PowerEdge C Series предусматривает специальный блок расширения PowerEdge C410x, представляющий собой платформу для установки карт с интерфейсом PCI Express x16.

Dell PowerEdge C 410x

Данный модуль высотой 3U позволяет установить 16 GPU-карт (10 спереди и 6 сзади) с TDP до 225 Вт каждая, и рассчитан прежде всего на установку GPGPU модулей NVIDIA Tesla M2050 с 448 ядрами CUDA архитектуры Fermi и тремя или шестью гигабайтами ECC GDDR-5 памяти.

Dell PowerEdge C 410x

Питание обеспечивают 4 блока мощностью 1400 Вт каждый, за охлаждение отвечают восемь 92-мм вентиляторов. Блоки питания и вентиляторы поддерживают отказоустойчивость и «горячую» замену. Модули карт поддерживают добавление на ходу, но не замену.

Dell PowerEdge C 410x

Совокупная вычислительная мощность платформы — более 16 000 GFLOPS и может быть разделена между 8 серверами PowerEdge C Series, подключаемыми с помощью внешних соединений PCI Express I-PASS к специальным интерфейсным картам NVIDIA HIC. Программная поддержка решения пока реализована лишь в Red Hat Enterprise Linux.

Dell уже поставила подобную систему как часть суперкомпьютера Lincoln для Национального суперкомпьютерного центра США, с вычислительной производительностью в 47 TFLOPS. Но подобный продукт, без сомнения, найдёт спрос и у корпоративных потребителей в области решений для виртуализации, поскольку и Microsoft, и VmWare уже объявили, что следующее поколение их продуктов будет поддерживать виртуализацию графического процессора, что позволит исполнять «тяжёлые» графические приложения в виртуальных машинах. Причём предварительная версия технологии Microsoft RemoteFX уже доступна в открытом для бета-тестирования Windows Server 2008 R2 SP1 Release Candidate.

Драйверы NVIDIA для Unix 256.53 — релиз

Новая версия драйверов для операционных систем Linux, FreeBSD и Solaris.

Драйверы NVIDIA для операционных систем семейства Unix версии 256.53 датированы 31 августа и поддерживают все текущие видеокарты и интегрированные графические ядра GeForce, Quadro и ION, начиная с NV40. Изменения не отличаются от изменений бета-версии 256.52, кроме того, добавлена поддержка вычислительных модулей Tesla M2050.

Загрузить драйверы можно по ссылкам ниже:

NVIDIA сообщает об убытках в размере 141 млн долл за II квартал финансового 2011 года

Как и ожидалось, результаты NVIDIA за второй квартал финансового 2011 года не принесли ничего хорошего.  Выручка достигла 811 200 000 долл, что на 19% меньше предыдущего квартала (на 4,5% больше, чем годом ранее), а чистый убыток составил 141 млн долл.

Компания из Санта-Клара списывает слабые результаты за счет медленного спроса на рынке GPU и влияние на результаты второго квартала расходов, связанных с ликвидацией последствий скандала 2008 года с дефектными подложками видеочипов и чипсетов. Компания списала на эти цели 193,9 млн долл.

Логотип NVIDIA

«Быстро меняющиеся условия рынка сделали интересным этот квартал», - сказал Jen-Hsun Huang, президент и генеральный директор NVIDIA. «Мы обеспечили отличные результаты на рынке профессиональной графики Quadro, на рынке GPU-вычислений — Tesla и рынке system-on-a-chip — Tegra. Но наш бизнес по производству GeForce значительно упал ниже ожиданий на фоне слабого спроса на ПК в Европе и Китае. Хотя спрос среди конечных пользователей остается неопределенным, мы ожидаем увеличения доходов и рост доли рынка с новыми продуктами, которые пользуются всё большим спросом».

В текущем квартале NVIDIA ожидает рост доходов от 3 до 5 процентов (по отношению к II кварталу).

Nebulae, китайский суперкомпьютер, использующий Fermi, ворвался в TOP-500

Недавно на конференции International Supercomputing Conference в Гамбурге был обновлён список Top-500 самых быстрых суперкомпьютеров мира. Главной неожиданностью стал выход на вторую строчку нового китайского суперкомпьютера Nebulae, установленного в Государственном суперкомпьютерном центре (Shenzhen Supercomputing Center).

Киитайский суперкомпьютер Nebulae вошёл в Топ-500 впервые и занял сразу второе место. Система обладает производительностью в 1,27 петафлопс (по данным теста Linpack), уступая американскому суперкомпьютеру Jaguar с показателем 1,76 петафлопс. В то же время китайская система является лидером по теоретической пиковой производительности с показателем 2,98 петафлопс. Nebulae работает на базе blade-системы Dawning TC3600 (производства Dawning China) с использованием процессоров Intel X5650 и графических чипов Nvidia Tesla C2050. Jaguar же был построен компанией Cray на базе преимущественно шестиядерных процессоров Opteron 2,6 ГГц каждый, и насчитывает 224162 ядер. У Nebulae количество ядер вдвое меньшее, чем у Jaguar — 120640.

На третьем месте оказался бывший лидер рейтинга — сконструированный в IBM первый в мире петафлопсовый суперкомпьютер Roadrunner из Национальной лаборатории в Лос-Аламосе. Он работает на процессорах PowerXCell 8i 3.2 ГГц и Opteron DC 1.8 ГГц.

Сотрудник PR-департамента NVIDIA о выходе Fermi и планах компании

PR есть PR, но порой оговорка «гуманитариев» даёт больше сведений, чем воз документации от «технарей».

Bryan Del Rizzo, менеджер департамента PR потребительских продуктов, дал интервью журналистам сайта TechREACTION.net во время выставки PAX East 2010, сразу после презентации первых видеокарт на базе Fermi. Мы приводим выдержку фактов из данного интервью.

  • В NVIDIA, безусловно, желали выпустить своё DirectX 11-решение к выходу Windows 7, но при создании микросхем такой сложности предсказать срок получения конечного продукта очень тяжело — обычно приходится пройти через множество ревизий.
  • NVIDIA будет продвигать архитектуру Fermi в профессиональные применения и в HPC, но не в ущерб продвижению решений для игр.
  • GPU, предназначенные для карт линейки Tesla, будут отличаться по возможностям и производительности от GPU видеокарт GeForce. В частности, в GeForce нет ECC-технологии.
  • Новые разновидности графических процессоров и видеокарт на базе Fermi запланированы на вторую половину этого года, по крайней мере в финансовом плане.
  •  Del Rizzo не смог подтвердить планы о выпуске двухпроцессорного решения GF100, но сообщил, что создание такого решения не является невыполнимой задачей для NVIDIA.
  • Слухи о принуждении партнёров NVIDIA к приобретению минимум 80 видеокарт на базе GT2x0 для получения одной карты GTX 400 — это просто слухи.
  • В NVIDIA не особо опасались за тепловой пакет GTX 470 и 480, на первом месте стоял вопрос достижения высокой производительности, а дальше шло то соображение, что «топовые» видеокарты покупают люди, приобретающие также соответствующие корпуса, в которых проблемы с охлаждением современных компонентов не стоят так остро.
  • Теселляция DirectX 11 неизбежно станет основной «фишкой» компьютерных игр, и 16 блоков теселляции в Fermi обеспечат значительное преимущество над одним блоком Cypress и его производных.
  • Главное достоинство 3D Vision — отсутствие у разработчиков игр необходимости переписывать игру для поддержки стерео, всю работу делает стереодрайвер NVIDIA. Но результат оказался удивительным — спустя год продаж в NVIDIA обнаружили, что разработчики игр стали адаптировать игры для наилучшего восприятия в стереорежиме, что лишь подчёркивает правильность выбранного направления.
  • 3D Vision Surround получит признание и распространение. После многомониторного стерео вернуться к «стандартному» стерео так же сложно, как после стерео вернуться к обычному псевдостерео на экране монитора.
  • До тех пор, пока NVIDIA удаётся продвигать новые технологии в разработку приложений, все в компании делают свою работу правильно.

NVIDIA logo