Новости про Intel и суперкомпьютеры

Intel отказывается от Xeon Phi

Ускорители Intel Xeon Phi, начавшиеся как проект Larrabee, так и не снискали коммерческого успеха, несмотря на заверения компании, что его программная модель куда более продуктивна, чем x86.

В то же время GPU NVIDIA прекрасно себя чувствует на рынке суперкомпьютеров, доминируя в вычислениях подобного типа. По сути, GPU Volta окончательно вытеснил Xeon Phi с рынка.

Ещё недавно Intel планировала выпуск нового поколения Xeon Phi под названием Knights Hill по 10 нм нормам. Однако задержки с реализацией 10 нм процесса наряду с низким интересом к Phi в целом, привели компанию к закрытию проекта. Сейчас Intel объявляет о прекращении производства восьми поставляемых моделей Xeon Phi.

Ускоритель Intel Xeon Phi

Под сокращение попали модели Xeon Phi 7210, 7210F, 7230, 7230F, 7250, 7250F, 7290 и 7290F. Эти ускорители ставились в сокеты для CPU. Карты расширения, с конструкцией графических плат, отменены достаточно давно.

Примечательно, что причиной сокращения выпуска названо изменение «рыночного спроса на эти продукты, который перешёл на другие решения Intel». Вот только у Intel не осталось решений, на которые можно было перенести спрос. У фирмы нет ничего, что можно было бы предложить в качестве ускорителя вычислений. Единственный шанс компании вернуться на этот рынок — проект нового GPU, который проектирует Раджа Кодури, и который появится лишь в следующем году, при оптимистичном сценарии.

NVIDIA выпустила Tesla K80

Компания NVIDIA анонсировала Tesla K80, новый двухчиповый ускоритель GPGPU для применения в расчётах с высокой производительностью.

В карте установлены два процессора GK210 семейства Kepler, что в сумме даёт 4992 ядра CUDA. На плате разведена шина памяти GDDR5 шириной 384 бита, которая передаёт данные на 24 ГБ памяти. Максимальная пропускная способность ускорителя K80 составляет 480 ГБ/с. NVIDIA обещает, что в операциях обычной точности производительность карты составит 8,74 терафлопса, а при двойной точности — 2,91 терафлопса.

Разработчики уверяют, что K80 обеспечивает вдвое большую производительность, по сравнению с одночиповым решением K40. Кроме того, этот ускоритель довольно скромно относится к энергоснабжению. Так, TDP K80 составляет 300 Вт, или по 150 Вт на GPU, в то время как K40 рассеивает 235 ватт тепла. Примечательно, что K80 имеет пассивное охлаждение, полностью полагаясь на эффективность вентиляторов шасси.

Несмотря на столь высокую эффективность, обозреватели полагают, что ожидать потребительскую версию K80 не стоит, ведь в отличие от рынка HPC, бытовой рынок уже перешёл на поколение Maxwell, таким образом, GK210 должен стать первым GPU компании, который не найдёт своего решения на потребительском уровне.

Intel рассказала о процессоре Knights Landing

В ходе международной конференции по суперкомпьютерам в немецком Лейпциге, компания Intel представила некоторые детали о новых суперкомпьютерных чипах, получивших название Knights Landing.

Высокая производительность этих чипов была продемонстрирована на этом же мероприятии год назад, но тогда было лишь объявлено о том, что его будут производить по 14 нм техпроцессу. В этом году Intel сообщила, что чип будет иметь архитектуру Silvermont и будет способен выполнять расчёты со скоростью до 3 терафлопс, и что самое важное, для взаимосвязи будет использовать Omni Scale.

О том, что же такое Omni Scale, пока известно крайне мало, но в Intel говорят, что это будет масштабируемая, нацеленная на будущее платформа, которая будет поддерживать абсолютно всё, от PC-адаптеров, новых свитчей, до собственных фотонных схем Intel и открытых программных инструментов. Таким образом, по словам гиганта электроники, проблемы с ограниченной пропускной способностью будут навсегда решены.

Что касается памяти, то чип получит 16 ГБ стэковой памяти изготовленной по технологии Micron Hybrid Memory Cube с применением связей Through Silicon Via. По мнению разработчиков, такой подход обеспечит пятикратную скорость, по сравнению с DDR4.

Сколько ядер будет в новом чипе, пока не сообщалось, но по слухам, их будет насчитываться 72 штуки.

Ожидается, что процессоры Xeon Phi Knights Landing будут поставляться коммерческим потребителям со второй половины 2015 года.

Nebulae, китайский суперкомпьютер, использующий Fermi, ворвался в TOP-500

Недавно на конференции International Supercomputing Conference в Гамбурге был обновлён список Top-500 самых быстрых суперкомпьютеров мира. Главной неожиданностью стал выход на вторую строчку нового китайского суперкомпьютера Nebulae, установленного в Государственном суперкомпьютерном центре (Shenzhen Supercomputing Center).

Киитайский суперкомпьютер Nebulae вошёл в Топ-500 впервые и занял сразу второе место. Система обладает производительностью в 1,27 петафлопс (по данным теста Linpack), уступая американскому суперкомпьютеру Jaguar с показателем 1,76 петафлопс. В то же время китайская система является лидером по теоретической пиковой производительности с показателем 2,98 петафлопс. Nebulae работает на базе blade-системы Dawning TC3600 (производства Dawning China) с использованием процессоров Intel X5650 и графических чипов Nvidia Tesla C2050. Jaguar же был построен компанией Cray на базе преимущественно шестиядерных процессоров Opteron 2,6 ГГц каждый, и насчитывает 224162 ядер. У Nebulae количество ядер вдвое меньшее, чем у Jaguar — 120640.

На третьем месте оказался бывший лидер рейтинга — сконструированный в IBM первый в мире петафлопсовый суперкомпьютер Roadrunner из Национальной лаборатории в Лос-Аламосе. Он работает на процессорах PowerXCell 8i 3.2 ГГц и Opteron DC 1.8 ГГц.

Intel демонстрирует систему построенную на 48-ядерном процессоре

В прошлом месяце Intel объявила о запуске ее экспериментальной системы с 48-ядерным процессором. Сегодня стали известны подробности.

Сайту X-bit labs был продемонстрирован суперкомпьютер (SCC), который работает на экспериментальной материнской плате Copper Ridge с интегрированной графикой, портами ввода-вывода и 8 слотами DIMM. На плате нет портов SATA, для хранения данных используется Intel USB флэш-диск.

Согласно докладу, SCC содержит 24 кристалла с двумя ядрами х86, каждый из которых имеет свой кэш L2 и может запускать отдельную ОС и программный стек, и действует как отдельный вычислительный узел, который связывается с другими вычислительными узлами через через коммутируемую сеть, оперирующую при своей работе пакетами. SCC также имеет четыре интегрированных контроллера памяти DDR3.

48-ядерный процессор имеет 24 встроенных маршрутизатора, которые обеспечивают быстрый обмен данными между ядрами. Каждое ядро также имеет встроенные буферы, данными из которых они (ядра) могут мгновенно обмениваться между собой. Разумеется, всё это происходит параллельно.

Intel также сообщает, что 48-ядерный процессор имеет более продвинутый интегрированный в ядро контроллер управления питанием, который может управлять  потребляемой мощностью, варьируя ее от 25 Вт до 125 Вт. Кроме того, он также умеет уменьшать тактовую частоту и отключать ядра для снижения  энергопотребления.

Что же касается тактовых частот, то современные десктопы и ноутбуки опережают это 48-ядерное чудо. Как заявляет Intel, их экспериментальный чип работает на тех же частотах, что процессор Atom, а это,  в свою очередь, подразумевает частоты в районе от 1,2 ГГц до 1,83 ГГц.

Cray запускает в производство суперкомпьютер с GPU NVIDIA Tesla

Вычислительные модули NVIDIA Tesla обеспечат 17 000 GFLOPS.

Известный изготовитель высокопроизводительных компьютеров Cray Ink. объявила о запуске новой линейки вычислительных кластеров CX1000. Наибольший интерес в новой линейке представляет модель CX1000-G, предлагающая использование GPGPU возможностей современных графических процессоров NVIDIA. CX1000-G допускает установку до 9 блоков, каждый из которых содержит два процессора Intel Xeon 5600, до 48 Гб оперативной памяти и два процессора NVIDIA Tesla M1060. С учётом производительности одного модуля Tesla в 933 GFLOPS, общая производительность кластера составит почти 17000 GFLOPS даже без учёта вычислительных возможностей центральных процессоров Intel.

Надо отметить, что графические процессоры уже прочно «прописались» в мире суперкомпьютеров. В прошлом году в список самых производительных компьютеров TOP500 ворвался китайский компьютер Tianhe-1. Производительность петафлопного уровня и пятое место в списке тогда обеспечили 2560 видеокарт AMD Radeon HD 4870×2.