Новости про суперкомпьютеры

AMD продвигает инициативу Boltzmann

Компания AMD основала новую программу под названием Boltzmann Initiative, которая использует гетерогенную архитектуру системы для объединения CPU и GPU от AMD с целью увеличения компьютерной эффективности.

Сообщается, что первый этап подготовки системы уже завершён. Вся инициатива включает Heterogeneous Compute Compiler (HCC), драйвер для Linux и инфраструктуру исполнения HSA для кластеров, инструменты High Performance Computing (HPC) и Heterogeneous-compute Interface for Portability (HIP), для портирования приложений для CUDA на C++.

AMD Boltzmann

Компания AMD надеется, что её новые инструменты увеличат производительность приложений в широком спектре задач, от машинного обучения до молекулярной динамики и от нефтяной и газовой отрасли до визуальных эффектов и компьютерных изображений.

По словам Джима Белка, солидера департамента США Цента соконструирования экзаскалярной энергии в экстремальных материалах, новый HCC C++ компилятор является ключевым инструментом для разработчиков, который позволит облегчить и эффективно применять аппаратные ресурсы в гетерогенных системах. Компилятор обеспечивает упрощённую разработку посредством исполнения единого кода, записанного для CPU и GPU в одном файле.

NVIDIA предсказывает общедоступность суперкомпьютеров

В ходе недавней конференции в Остине, штат Техас, исполнительный директор NVIDIA Дзень-Хсунь Хуан рассказал, что видит широкие возможности для распространения суперкомпьютеров во многих отраслях промышленности.

Хуан пояснил, что суперкомпьютерные технологии хорошо продвигаются за пределы традиционных суперкомпьютерных систем, и технологии GPU станут частью будущих технологий, таких как автономные транспортные средства и персональные роботизированные помощники. Компания NVIDIA уже активно работает в этих отраслях, предложив автомобильный компьютер NVIDIA Drive PX и модуль машинного обучения Jetson TX1.

Супркомпьютеры везде

За последние пару лет графические процессоры нашли своё применение во многих суперкомпьютерах. По словам NVIDIA, использование GPU акселераторов в списке top500 суперкомпьютеров растёт ежегодно на 50%, а графический процессор Tesla использован в 23 из 24 новых суперкомпьютерах с GPGPU ускорением.

Количество ускоренных суперкомпьютеров

В будущем машинное обучение увеличит спрос на GPU ещё больше. Машинное обучение является «первоочередным применением высокопроизводительных вычислений для потребителей» — отметил Хуан. «Технология позволит технологии стать автономной в сложности реального мира и станет инструментом для производства автономных транспортных средств и машин, подобных персональным роботам-помощникам».

Процессор EHP AMD получит до 32 ядер

Компания AMD опубликовала информацию о своём новом экзаскалярном гетерогенном процессоре (Exascale Heterogenous Processor — EHP), который предназначен для суперкомпьютеров.

По сути EHP представляет собой традиционный APU, только изготовленный в большем масштабе. Новый процессор будет родственен недавно выпущенному GPU Fiji с собственным контроллером и памятью на ядре.

AMD EHP

Непосредственно чип будет включать различные компоненты. Среди них будет набор вычислительных ядер, блок GPGPU, всё это будет подключено к встроенному контроллеру и оснащено до 32 ГБ памяти HBM2, которая также будет поставляться в общем пакете. Что касается CPU, то отмечается, что чип будет включать 32 ядра архитектуры Zen, заключённых в 8 четырёхъядерных блоков.

Надо отметить, что объединение CPU, GPU с GPGPU функционалом и быстрой памятью с широкой шиной должно обеспечить отменную производительность такому решению. Первые инженерные образцы EHP компания планирует изготовить в 2016—17 годах.

NVIDIA выпустила Tesla K80

Компания NVIDIA анонсировала Tesla K80, новый двухчиповый ускоритель GPGPU для применения в расчётах с высокой производительностью.

В карте установлены два процессора GK210 семейства Kepler, что в сумме даёт 4992 ядра CUDA. На плате разведена шина памяти GDDR5 шириной 384 бита, которая передаёт данные на 24 ГБ памяти. Максимальная пропускная способность ускорителя K80 составляет 480 ГБ/с. NVIDIA обещает, что в операциях обычной точности производительность карты составит 8,74 терафлопса, а при двойной точности — 2,91 терафлопса.

NVIDIA Tesla K80

Разработчики уверяют, что K80 обеспечивает вдвое большую производительность, по сравнению с одночиповым решением K40. Кроме того, этот ускоритель довольно скромно относится к энергоснабжению. Так, TDP K80 составляет 300 Вт, или по 150 Вт на GPU, в то время как K40 рассеивает 235 ватт тепла. Примечательно, что K80 имеет пассивное охлаждение, полностью полагаясь на эффективность вентиляторов шасси.

Несмотря на столь высокую эффективность, обозреватели полагают, что ожидать потребительскую версию K80 не стоит, ведь в отличие от рынка HPC, бытовой рынок уже перешёл на поколение Maxwell, таким образом, GK210 должен стать первым GPU компании, который не найдёт своего решения на потребительском уровне.

Intel рассказала о процессоре Knights Landing

В ходе международной конференции по суперкомпьютерам в немецком Лейпциге, компания Intel представила некоторые детали о новых суперкомпьютерных чипах, получивших название Knights Landing.

Высокая производительность этих чипов была продемонстрирована на этом же мероприятии год назад, но тогда было лишь объявлено о том, что его будут производить по 14 нм техпроцессу. В этом году Intel сообщила, что чип будет иметь архитектуру Silvermont и будет способен выполнять расчёты со скоростью до 3 терафлопс, и что самое важное, для взаимосвязи будет использовать Omni Scale.

Intel Xeon Phi

О том, что же такое Omni Scale, пока известно крайне мало, но в Intel говорят, что это будет масштабируемая, нацеленная на будущее платформа, которая будет поддерживать абсолютно всё, от PC-адаптеров, новых свитчей, до собственных фотонных схем Intel и открытых программных инструментов. Таким образом, по словам гиганта электроники, проблемы с ограниченной пропускной способностью будут навсегда решены.

Что касается памяти, то чип получит 16 ГБ стэковой памяти изготовленной по технологии Micron Hybrid Memory Cube с применением связей Through Silicon Via. По мнению разработчиков, такой подход обеспечит пятикратную скорость, по сравнению с DDR4.

Intel Xeon Phi

Сколько ядер будет в новом чипе, пока не сообщалось, но по слухам, их будет насчитываться 72 штуки.

Ожидается, что процессоры Xeon Phi Knights Landing будут поставляться коммерческим потребителям со второй половины 2015 года.

NVIDIA представила ускоритель Tesla K40

В ходе конференции SC13 компания NVIDIA представила самый производительный в мире видеоускоритель Tesla K40, сделав это вслед за AMD Firepro S10000 12 GB.

Как и положено ускорителям Tesla, он предназначен для суперкомпьютеров и он на целых 40% превышает по производительности Tesla K20X. Кроме того, этот ускоритель в 10 раз быстрее самого быстрого на сегодня CPU. Таким образом, ускоритель Firepro S10000 12 GB пробыл на вершине всего несколько дней.

«GPU ускорители стали мейнстрим продуктом в высокопроизводительных ПК и суперкомпьютерах, позволяя инженерам и учёным создавать новшества и делать научные открытия», — заявил Сумит Гупта, главный менеджер NVIDIA по продуктам ускоренных вычислений.

Tesla K40

Что касается аппаратной части, то K40 получил 2880 ядер CUDA с базовой частотой 745 МГц и до 875 МГц в режиме Boost, в то время как прошлое поколение, K20X, имело 2688 ядер частотой 732 МГц. В новой плате также используется более быстрая память GDDR5 частотой 3 ГГц, объём которой также как и противоборствующего лагеря составляет 12 ГБ.

В пресс-релизе компания указала, что  «ускоритель Tesla K40 обходит остальные ускорители по двум главным показателям вычислительной производительности: 4,29 терафлопса с обычной точностью и 1,43 терафлопса пиковой производительности с двойной точностью». Надо сказать, что это не совсем правда, поскольку AMD удалось сделать свой ускоритель с производительностью в 1,48 терафлопса при двойной точности вычислений.

Несмотря на недавний анонс, у NVIDIA уже есть первый клиент на новые платы. Им стал Техасский современный вычислительный центр в Остине, который планирует запустить новую интерактивную систему удалённой визуализации и анализа данных, под именем Maverick, уже в январе будущего года.

Самый быстрый в мире компьютер слишком быстрый?

Когда в Китае запустили Tianhe-2, у страны появился повод похвастать самой производительной в мире вычислительной системой, но теперь выясняется, что этот суперкомпьютер оказался слишком быстрым для большинства задач.

Суперкомпьютер Tianhe-2 может выполнять 33860 триллионов операций в секунду, однако скорее всего такая производительность никогда не будет использоваться на полную мощность. По данным издания China Morning Post, учёный, доктор Као Юнь заявил, что огромный массив данных препятствует работе вычислительного монстра и более медленные машины Института физики высоких энергий Китайской Академии Наук могут выполнять ту же работу быстрее и дешевле. Это значит, что новый суперкомпьютер неприменим для расчётов физики высоких энергий и учёный не уверен, пригодится ли он вообще.

Суперкомпьютер Tianhe-2

На самом деле для современных суперкомпьютеров это большая проблема. К примеру Titan, построенный Cray в Национальной Лаборатории Ок Ридж, Теннеси, использовался лишь в шести практически одинаковых проектах связанных с молекулярной физикой, эмулируя сжигание топлива в двигателе для повышения его эффективности и моделирования передвижения молекул воздуха при изменении климата.

Ожидалось, что Tianhe-2 будет контролировать работу светофоров, предсказывать землетрясения, разрабатывать новые лекарства, проектировать автомобили и создавать спецэффекты для кино, но в реальности этот многоцелевой компьютер не слишком-то хорош, как большинство дорогих городских суперкомпьютеров, и большую часть своей жизни он будет просто простаивать.

Сеть Bitcoin быстрее, чем 500 суперкомпьютеров вместе взятых

Вычислительная мощность сети Bitcoin, использующая персональные компьютеры для майнинга, превзошла 1 экзафлоп, а это в 8 раз быстрее, чем 500 лучших мировых суперкомпьютеров вместе взятых.

По данным bitcoinwatch.com, хэшрейт сети bitcoin превысил 1 экзафлоп. Конечно, это не технически выверенное число, поскольку сам процесс майнинга не требует проведения операций с плавающей запятой, основываясь лишь на расчётах целых чисел, так что это число скорее оценочное. Тем не менее, эта цифра говорит о том, что общая вычислительная мощь сети теперь в 8 раз больше, чем у 500 самых быстрых суперкомпьютеров в мире, вместе взятых.

Bitcoin

Сами флопы оцениваются на основе ресурсов видеокарты, затрачиваемых на расчёт одного хэша системы. Так, на подсчёт одного хэша тратится 12700 флоп, а значит можно и рассчитать общую производительность системы. Оценочным же данный расчёт стал после выпуска в 2011 году специализированной микросхемы для майнинга. Поскольку эта микросхема не выполняет вообще никаких операций с плавающей запятой, то и говорить о её влиянии на общие экзафлопы нельзя.

Cамый быстрый суперкомпьютер IBM Sequoia

Тем не менее, 1 экзафлоп это очень большая величина. К примеру, самый быстрый на сегодня суперкомпьютер — IBM Sequoia, имеет производительность равную 16,3 петафлопа, или 1,6% от общей мощности сети.

Разработан независающий компьютер

Рано или поздно, но все мы сталкиваемся с зависанием компьютеров, и в зависимости от задачи, которую вы выполняете, очередной сбой может вызвать раздражение, а может обернуться и полной катастрофой.

Но к счастью, учёные и исследователи из Университетского колледжа Лондона разработали решение, которое позволит навсегда попрощаться с синим экраном смерти.

В процессе работы современные компьютеры берут данные из памяти, обрабатывают их, а затем снова возвращают в ОЗУ. Такой порядок работы в обычных условиях не вызывает проблем, однако в случае наличия ошибок в программе возникают проблемы и с передачей данных, в результате чего происходит сбой в работе системы.

Скажем "нет" синему экрану смерти!

Главным отличием компьютера, разработанного в Лондоне, является то, что все данные и инструкции постоянно зеркалируются на различных системах. Системы работают одновременно и независимо одна от другой, и единственная вещь, которой они обмениваются — это участки памяти с контекстными данными.

В случае сбоя в работе одной из систем или повреждения данных, компьютер может восстановить их из другой системы и начать выполнение инструкции заново.

Конечно, при таком подходе нельзя похвастать высокой производительностью, но у учёных ещё есть много идей по совершенствованию разработанной схемы вычислений. К тому же система может оказаться полезной там, где важна высокая надёжность, например в военном ведомстве или в энергетике.

NVIDIA ускоряет суперкомпьютер «Ломоносов»

САНТА-КЛАРА, Калифорния — 15 июня, 2011 — Российские ученые решили обратиться к суперкомпьютерам на базе GPU для решения научных задач, и сегодня Московский государственный университет имени М.В. Ломоносова оснащает свой суперкомпьютер «Ломоносов» графическими процессорами NVIDIA Tesla, благодаря чему он станет одной из самых быстрых вычислительных машин в мире.

Гибридное расширение «Ломоносова» состоит из 1554 графических процессоров NVIDIA Tesla X2070 и такого же числа четырехъядерных CPU, обеспечивая всю систему пиковой производительностью 1,3 петафлопс, что делает ее самым быстрым суперкомпьютером в России и одной из самых быстрых вычислительных систем в мире.

Суперкомпьютерные ресурсы МГУ используется в первую очередь для выполнения фундаментальных научных исследований, предполагающих ресурсоемкие вычисления. Среди таких задач масштабные работы по глобальному изменению климата и динамике мирового океана, постгеномной медицине, механизмам формирования галактик и др.

Суперкомпьютер "Ломоносов"

«Для наших исследований требуются огромные вычислительные ресурсы, и мы должны обеспечить необходимую производительность максимально эффективным способом»,— отметил Виктор Садовничий, академик РАН, ректор Московского государственного университета. «Единственно возможный способ добиться этих целей одновременно – использование гибридных вычислительных систем на базе GPU/CPU», добавил он.

Более подробно о новом расширении Tesla для суперкомпьютера «Ломоносов» можно прочесть на сайте NVIDIA.