Новости про Tesla

NVIDIA выпускает Kepler для облачных игровых сервисов

Несмотря на множественные разговоры о разработках компании в промышленности, науке и бизнесе, которые состоялись на NVIDIA GPU Technology Conference, компания не забыла и об игровых графических процессорах.

Сегодня NVIDIA анонсировала то, что было названо облачной игровой платформой GeForce Grid, которая представляет собой потоковый сервис виртуализации игр будущего поколения на любом устройстве без заметных задержек, которые могут ухудшить геймплей.

Система облачного рендера NVIDIA

Используя архитектуру Kepler, GeForce Grid GPU минимизирует энергопотребление, позволяя кодировать одновременно до восьми игровых потоков. Это даёт возможность провайдерам повысить экономическую эффективность служб, предлагая одновременно услуги сотням игроков.

GeForce Grid GPU

В основе предложенного решения лежит двухпроцессорная видеокарта, при этом каждый GPU имеет собственный кодировщик. Суммарно два процессора имеют 3072 ядра CUDA, общая вычислительная способность которых составляет 4,7 терафлопса. Вся эта мощь позволит провайдерам услуги осуществлять рендер высокосложных игр в облаке, кодировать их на GPU, быстрее чем на CPU, что обеспечит большее число одновременно обрабатываемых потоков. Благодаря новой энергоэффективной архитектуре, весь вычислительный центр будет потреблять в два раза меньше электроэнергии, чем на предыдущих видеоускрителях.

Схема передачи данных

На конференции GTC компания NVIDIA, совместно с Gaikai, продемонстрировали виртуальную игровую консоль на телевизоре LG Cinema 3D Smart TV, на котором работало приложение Gaikai, подключенное к серверу с GeForce Grid GPU, расположенном в 10 милях. В результате был показан быстрый и сглаженный геймплей без каких-либо заметных задержек. При этом телевизор был подключен посредством кабеля Ethernet, а игровой контроллер через беспроводной USB адаптер.

Сравнение уровней задержек GRID и прочих систем

На вопрос об уровне задержек исполнительный директор NVIDIA Дзень-Сунь Хуан разъяснил, что задержки их системы составляют порядка 100 мс, что даже немного лучше, чем на современных консолях. Это достигается за счёт того, что нынешние приставки построены на технологиях 7-и летней давности, кроме того, ускоритель Kepler не использует кадровый буфер ввиду высокой производительности.

Энергоэффективность серверов GeForce Grid

В будущем NVIDIA видит возрастающую популярность сервисов вещания игр, подобных Netflix. По мнению компании, видеопроцессоры Kepler способны положить начало широкой популяризации подобных служб, поскольку вместо современной концепции, предполагающей по одной видеокарте каждому игроку, будут использовать одну карту несколькими геймерами. Ожидаемая цена месячной подписки на все игры провайдера будет составлять порядка 10 долларов США.

NVIDIA ускоряет суперкомпьютер «Ломоносов»

САНТА-КЛАРА, Калифорния — 15 июня, 2011 — Российские ученые решили обратиться к суперкомпьютерам на базе GPU для решения научных задач, и сегодня Московский государственный университет имени М.В. Ломоносова оснащает свой суперкомпьютер «Ломоносов» графическими процессорами NVIDIA Tesla, благодаря чему он станет одной из самых быстрых вычислительных машин в мире.

Гибридное расширение «Ломоносова» состоит из 1554 графических процессоров NVIDIA Tesla X2070 и такого же числа четырехъядерных CPU, обеспечивая всю систему пиковой производительностью 1,3 петафлопс, что делает ее самым быстрым суперкомпьютером в России и одной из самых быстрых вычислительных систем в мире.

Суперкомпьютерные ресурсы МГУ используется в первую очередь для выполнения фундаментальных научных исследований, предполагающих ресурсоемкие вычисления. Среди таких задач масштабные работы по глобальному изменению климата и динамике мирового океана, постгеномной медицине, механизмам формирования галактик и др.

Суперкомпьютер "Ломоносов"

«Для наших исследований требуются огромные вычислительные ресурсы, и мы должны обеспечить необходимую производительность максимально эффективным способом»,— отметил Виктор Садовничий, академик РАН, ректор Московского государственного университета. «Единственно возможный способ добиться этих целей одновременно – использование гибридных вычислительных систем на базе GPU/CPU», добавил он.

Более подробно о новом расширении Tesla для суперкомпьютера «Ломоносов» можно прочесть на сайте NVIDIA.

Intel готовится выпустить ускорители с архитектурой Many Integrated Core в ближайшее время

Intel рассчитывает запустить первые Many Integrated Core (MIC) используя готовящийся к внедрению 22 нм техпроцесс, при этом планируется привлечь более 100 разработчиков для MIC до конца 2011 года.

Ожидается, что дополнительный акселератор микроархитектуры Intel MIC будет использоваться для сильно распараллеленных приложений в высокопроизводительных вычислениях, в таких сегментах как научные исследования и погодное моделирование. Но в отличие от AMD FireStream или NVIDIA Tesla, Intel хочет, чтобы их технология не заменила процессоры, а ускорила существующие приложения.

Дополнительный акселератор микроархитектуры Intel MIC

Intel настаивает, что х86-совместимость даст MIC уникальное преимущество. Кирк Скоген (Kirk Skaugen), вице-президент архитектурной группы и главный менеджер группы датацентра Intel, во время своего доклада на Intel Developer Forum сказал, что MIC будет, как бы, сопроцессором, на котором вы сможете использовать те же компиляторы, те же инструменты, тот же VTune. При этом вычислительная мощность составит порядка 90% самых производительных мировых компьютеров.

Он также пообещал, что когда вы запустите компилятор следующего поколения, он уже будет оптимально загружать ядра Intel, находящиеся в процессорах Xeon, и он будет оптимизировать загрузку на новых PCI Express картах, которые будут иметь более чем 50 ядер изготовленных по 22 нм технологии.

А пока Intel представила тестовую платформу под названием Knights Ferry, предназначенную для отбора разработчиков и планы по увеличению числа разработчиков, имеющих необходимое оборудование, до сотни, к концу 2011 года.

Суперкомпьютеры с процессорами NVIDIA возглавили Top-500

Три вооружённых чипами NVIDIA суперкомпьютера оккупировали верхние строчки списка.

Ноябрьский список Top500 принёс ожидаемое первое место китайскому суперкомпьютеру Tianhe-1A, 2,7 петафлопа которому обеспечили вычислительные модули NVIDIA Tesla. Однако, он оказался не единственным GPU-ускоренным суперкомпьютером в верхних строчках списка. На третьем месте расположился предтеча Tianhe-1A, суперкомпьютер Nebulae, также оснащённый модулями Tesla, c общей производительностью в 1,27 петафлоп. Четвёртое место занял еще один новичок в списке, суперкомпьютер Tsubame 2.0 из Японии, в результат которого в 1,19 петафлоп основной вклад внесли процессоры NVIDIA Tesla.

Продукты компании Cray Inc продолжают удерживать половину верхней десятки списка, но такими темпами перевес скоро окажется не на их стороне и количественно.

Tsubame 2.0 Tesla HPC

CPU против GPU: новый раунд

Плюс прогноз применимости GPGPU для суперкомпьютеров.

В этом году IBM публиковала два исследования, в которых сравнивалась производительность CPU и GPU в математических задачах. В первом случае центральный процессор IBM Power 7 опередил GeForce GTX 285, причём двухпроцессорная система на базе Intel Xeon показала лишь чуть меньший результат, во втором испытании модуль NVIDIA Tesla 2050 опередил всех соперников, но разрыв в производительности составил чуть более двухкратного для Power 7 и не дотянул до четырёхкратного над Xeon. И вот появилось новое исследование, от университетов Оксфорда и Ворвика, Великобритания, в котором системам на базе Xeon были противопоставлены модули Tesla разных поколений и пара «бытовых» видеокарт.

Xeon vs CUDA results

Хотя для исполнения на CUDA использованный тест NAS LU пришлось портировать с Fortran на C, результат представляет немалый интерес. Всего один четырёхъядерный процессор Xeon X5550, работающий на частоте 2,66 ГГц, смог показать лучший результат, чем GeForce 9800 GT с теоретической производительностью 500 GFLOPS. GeForce 8400 GS из-за ограниченного буфера памяти (256 Мб) смогла выполнить лишь один этап из трёх и показала ужасную производительность. Модули Tesla оправдали свою репутацию, но отрыв в производительности не превышал 10-кратного. Любопытно, что включение режима защиты памяти ECC на Tesla 2050 стоило ей 20 % производительности, в том числе из-за потери 16 % объема видеопамяти на контрольные суммы.

Британские учёные не могли хотя бы частично не подтвердить свою репутацию. На основе полученных данных они попытались спрогнозировать производительность суперкомпьютерных систем на базе Tesla, сравнив их предсказанную производительность с хорошо себя зарекомендовавшими системами BlueGene /P от IBM.

Tesla vs BlueGene preview

Согласно предсказанию, традиционный подход к построению суперкомпьютеров выиграет по соотношению фактической производительности на Ватт, и в конечном итоге — по быстродействию вообще. Впрочем, GPU уже сделали заявку на лидерство среди суперкомпьютеров, посмотрим, что сможет на неё ответить та же IBM.

Китайский суперкомпьютер Tianhe-1A достиг быстродействия в 2,5 петафлопс используя NVIDIA Tesla

Микросхемы от NVIDIA приводят в действие самый мощный на сегодняшний день суперкомпьютер.

Китайский суперкомпьютер «Tianhe-1A» достиг быстродействия в 2,507 петафлопс, используя 7168 чипов NVIDIA Tesla M2050 и 14336 процессоров Intel Xeon. Это выше предыдущего рекорда (который тоже, кстати, поставлен в Поднебесной) суперкомпьютера «Nebulae», где также использовались чипы NVIDIA Tesla, обеспечившие производительность в 1,271 петафлопс.

NVIDIA Tesla

Кроме того, по заявлению источника, представители NVIDIA заявили, что суперкомпьютер «Tianhe-1A» не только самый быстрый в мире, но и самый «зелёный», так как использует для своей работы всего лишь 4,04 мегаватта энергии. А это почти в 3 раза меньше для достижения аналогичной производительности при использовании в системе только CPU.

По заявлению менеджера по маркетингу чипа Tesla NVIDIA Sumit Gupta, приложения данного «open science project» будут использоваться для исследовательских работ в области астрофизики, биохимии и других прикладных наук.

Стоимость одних использованных карт Tesla для построения системы составила почти 18 миллионов долларов, но одна из самых мощных экономик мира легко может позволить себе такие затраты на фундаментальные научные исследования. Предположительно, «Tianhe-1A» займёт первую строчку в следующем выпуске рейтинга суперкомпьютеров TOP-500, скинув с пьедестала все суперкомпьютеры США и Европы.

Серверы Dell с готовностью к GPGPU и виртуализации

Модульный сервер позволяет установить до 16 GPU-карт PCI Express.

Компания Dell для своих новых серверов линейки PowerEdge C Series предусматривает специальный блок расширения PowerEdge C410x, представляющий собой платформу для установки карт с интерфейсом PCI Express x16.

Dell PowerEdge C 410x

Данный модуль высотой 3U позволяет установить 16 GPU-карт (10 спереди и 6 сзади) с TDP до 225 Вт каждая, и рассчитан прежде всего на установку GPGPU модулей NVIDIA Tesla M2050 с 448 ядрами CUDA архитектуры Fermi и тремя или шестью гигабайтами ECC GDDR-5 памяти.

Dell PowerEdge C 410x

Питание обеспечивают 4 блока мощностью 1400 Вт каждый, за охлаждение отвечают восемь 92-мм вентиляторов. Блоки питания и вентиляторы поддерживают отказоустойчивость и «горячую» замену. Модули карт поддерживают добавление на ходу, но не замену.

Dell PowerEdge C 410x

Совокупная вычислительная мощность платформы — более 16 000 GFLOPS и может быть разделена между 8 серверами PowerEdge C Series, подключаемыми с помощью внешних соединений PCI Express I-PASS к специальным интерфейсным картам NVIDIA HIC. Программная поддержка решения пока реализована лишь в Red Hat Enterprise Linux.

Dell уже поставила подобную систему как часть суперкомпьютера Lincoln для Национального суперкомпьютерного центра США, с вычислительной производительностью в 47 TFLOPS. Но подобный продукт, без сомнения, найдёт спрос и у корпоративных потребителей в области решений для виртуализации, поскольку и Microsoft, и VmWare уже объявили, что следующее поколение их продуктов будет поддерживать виртуализацию графического процессора, что позволит исполнять «тяжёлые» графические приложения в виртуальных машинах. Причём предварительная версия технологии Microsoft RemoteFX уже доступна в открытом для бета-тестирования Windows Server 2008 R2 SP1 Release Candidate.

Драйверы NVIDIA для Unix 256.53 — релиз

Новая версия драйверов для операционных систем Linux, FreeBSD и Solaris.

Драйверы NVIDIA для операционных систем семейства Unix версии 256.53 датированы 31 августа и поддерживают все текущие видеокарты и интегрированные графические ядра GeForce, Quadro и ION, начиная с NV40. Изменения не отличаются от изменений бета-версии 256.52, кроме того, добавлена поддержка вычислительных модулей Tesla M2050.

Загрузить драйверы можно по ссылкам ниже:

NVIDIA сообщает об убытках в размере 141 млн долл за II квартал финансового 2011 года

Как и ожидалось, результаты NVIDIA за второй квартал финансового 2011 года не принесли ничего хорошего.  Выручка достигла 811 200 000 долл, что на 19% меньше предыдущего квартала (на 4,5% больше, чем годом ранее), а чистый убыток составил 141 млн долл.

Компания из Санта-Клара списывает слабые результаты за счет медленного спроса на рынке GPU и влияние на результаты второго квартала расходов, связанных с ликвидацией последствий скандала 2008 года с дефектными подложками видеочипов и чипсетов. Компания списала на эти цели 193,9 млн долл.

Логотип NVIDIA

«Быстро меняющиеся условия рынка сделали интересным этот квартал», - сказал Jen-Hsun Huang, президент и генеральный директор NVIDIA. «Мы обеспечили отличные результаты на рынке профессиональной графики Quadro, на рынке GPU-вычислений — Tesla и рынке system-on-a-chip — Tegra. Но наш бизнес по производству GeForce значительно упал ниже ожиданий на фоне слабого спроса на ПК в Европе и Китае. Хотя спрос среди конечных пользователей остается неопределенным, мы ожидаем увеличения доходов и рост доли рынка с новыми продуктами, которые пользуются всё большим спросом».

В текущем квартале NVIDIA ожидает рост доходов от 3 до 5 процентов (по отношению к II кварталу).

Nebulae, китайский суперкомпьютер, использующий Fermi, ворвался в TOP-500

Недавно на конференции International Supercomputing Conference в Гамбурге был обновлён список Top-500 самых быстрых суперкомпьютеров мира. Главной неожиданностью стал выход на вторую строчку нового китайского суперкомпьютера Nebulae, установленного в Государственном суперкомпьютерном центре (Shenzhen Supercomputing Center).

Киитайский суперкомпьютер Nebulae вошёл в Топ-500 впервые и занял сразу второе место. Система обладает производительностью в 1,27 петафлопс (по данным теста Linpack), уступая американскому суперкомпьютеру Jaguar с показателем 1,76 петафлопс. В то же время китайская система является лидером по теоретической пиковой производительности с показателем 2,98 петафлопс. Nebulae работает на базе blade-системы Dawning TC3600 (производства Dawning China) с использованием процессоров Intel X5650 и графических чипов Nvidia Tesla C2050. Jaguar же был построен компанией Cray на базе преимущественно шестиядерных процессоров Opteron 2,6 ГГц каждый, и насчитывает 224162 ядер. У Nebulae количество ядер вдвое меньшее, чем у Jaguar — 120640.

На третьем месте оказался бывший лидер рейтинга — сконструированный в IBM первый в мире петафлопсовый суперкомпьютер Roadrunner из Национальной лаборатории в Лос-Аламосе. Он работает на процессорах PowerXCell 8i 3.2 ГГц и Opteron DC 1.8 ГГц.