Новости про GP100 и NVIDIA

Появились новые детали об архитектуре GP100

Представленный графический процессор GP100 от NVIDIA несомненно обладает огромной производительностью, но не до конца понятно, как он устроен, и мы предлагаем в этом разобраться.

Для начала нужно отметить, что GP100 является многочиповым модулем, подобным AMD Fiji. Он состоит из большого ядра GPU, четырёх стеков памяти и кремниевой пластины, действующей в качестве подложки для GPU и стеков памяти, и позволяющей NVIDIA соединять все компоненты микроскопическими дорожками. Процессор GP100 содержит 4096-битную память HBM2 с типичной пропускной способностью до 1 ТБ/с. В представленной модели пропускная способность памяти составляет 720 ГБ/с.

Структура GP100 довольно похожа на прочие GPU NVIDIA за исключением изменений в двух главных интерфейсах — шине и памяти. Хост интерфейс PCI-Express gen 3.0 x16 подключает GPU к вашей системе, а GigaThread Engine разделяет нагрузку между шестью графическими процессорными кластерами. Восемь контроллеров памяти обеспечивают шину памяти в 4096 бит, а новый компонент High-speed Hub связывает четыре порта NVLink. В настоящее время неизвестно, каждый ли порт имеет пропускную способность в 80 ГБ/с (на направление) или все 4 порта вместе.

Шесть графических кластеров GP100 практически независимы, они имеют собственные фронт- и бэкэнды рендера. В архитектуре Pascal, как минимум в GP100, каждый кластер состоит из 10 потоковых мультипроцессоров (SM), основных рабочих единиц GPU. Каждый же SM содержит 64 ядра CUDA. Таким образом, каждый кластер содержит 640 ядер CUDA, а всего в GP100 их 3840 штук. Ещё одним важным параметром является число TMU, которых в этом GPU 240 штук. В ускорителе Tesla P100 NVIDIA оставила активными 56 из 60 мультипроцессоров.

Архитектура Pascal спроектирована для работы на высоких частотах. В частности, P100 работает на номинальной частоте 1328 МГц с 1480 МГц в режиме Boost и тепловыделением на уровне 300 Вт. Эта цифра может вас напугать, но не стоит забывать, что чипы памяти были перемещены на GPU, так что это суммарный TDP всех микросхем.

Последним новшеством, заслуживающим вниманием, стала шина NVLink. Это средство связи, разработанное NVIDIA, которое похоже на шину QPI от Intel или HyperTransport от AMD. Каждая линия NVLink обеспечивает пропускную способность в 80 ГБ/с на направление, что обеспечивает настоящую виртуализацию памяти между разными GPU.

Как отмечалось ранее, первые видеокарты на базе Pascal должны появиться в начале лета.

Процессор GP100 получит производительность в 4 терафлопса

Готовящийся к выпуску компанией NVIDIA графический процессор GP100 должен стать настоящим монстром вычислений.

Если верить просочившемуся недавно в сеть слайду с результатами исследований NVIDIA, новый флагманский чип Pascal получит скорость операций с плавающей запятой двойной точности на уровне 4 терафлопс, втрое больше, чем у Tesla K20, основанной на чипе GK110, производительность которого составляет 1,31 терафлопс.

На том же слайде также представлена и скорость работы с плавающей запятой в операциях обычной точности, которая достигает 12 терафлопс, в четыре раза больше, чем у GK110, и почти вдвое, чем у GM200. Также представленный слайд мог бы положить конец слухам, если бы сам не был спекуляцией, о том, что видеокарта на базе процессора GP100 будет использовать видеопамять GDDR5X. Учитывая тот факт, что на слайде заявлена пропускная способность памяти в 1 ТБ/с, нет сомнений, что будет использована стековая память HBM2.

Флагман Pascal может появиться уже в апреле

В Сети появилась новая дорожная карта, демонстрирующая интересную вещь.

Согласно этому документу, графический процессор NVIDIA Pascal появится на рынке уже в апреле. Причём компания готовит сразу два процессора. Первый из них, запланированный на апрель, будет предназначен для карт класса Titan, а второй — мейнстрим класса, появятся в июне.

Поскольку 14/16 нм технология производства будет готова для мощных процессоров в мае/июне, вероятно, говорить об апрельском релизе немного преждевременно. По всей видимости, старшая модель GPU будет называться GP100, будет изготовлен на заводе TSMC и будет содержать порядка 16 миллиардов транзисторов.

Пока не понятно, какой тип памяти будет использоваться во флагманских видеокартах. Разработчики уверенно говорят об использовании HBM2, однако выпустить такое решение в апреле будет сложно, поэтому вероятность появления флагмана с памятью GDDR5X довольно высока. В начале лета компания NVIDIA должна выпустить чип GP104 для видеокарт GTX 1080 и GTX 1070 (если, конечно, NVIDIA сохранит линейку продуктов). Эти чипы будут иметь размер 37,5x37,5 мм и содержать 2152 контакта.

Представленный слайд получен не у самой NVIDIA, так что его подлинность остаётся под вопросом.

NVIDIA рассылает процессор GP104

В Сети появилась информация о том, что компания NVIDIA начала рассылку своим партнёрам нового процессора GP104, который придёт на смену GM204, для его тестирования.

Новый чип имеет пакет BGA размером 37,5х37,5 мм, что немного меньше нынешнего процессора GM204, габариты которого составляют 40х40 мм. Также известно, что новый чип получит 2152 контакта, что заметно больше 1754 ножек у нынешнего аналога.

Ожидается, что GP104 может поддерживать память GDDR5X, в то время как HBM2 может быть зарезервирована за флагманским GPU — GP100. Ожидается, что этот чип будет иметь пакет 55х55 мм, немногим больше GM200, что связано с включением в его конструкцию памяти HBM2.

Таким образом, размеры самих GPU GP100 и GP104 будут меньше, чем у GM200 и GM204 соответственно. Процессоры Pascal станут первым поколением чипов NVIDIA, в которых будет использована стековая память, поэтому прорыв в производительности, какой мы наблюдали при переходе от Kepler к Maxwell, произойдёт позднее. Сейчас же компания просто попытается изготовить процессор более быстрым и энергоэффективным. Кроме того, это первые попытки изготовления мощных процессоров по технологии FinFET, поэтому с её развитием появится и возможность выпуска более совершенных чипов.

Как видно по декларациям на Zauba, одна из видеокарт на базе GP104 будет иметь водяное охлаждение, так что возможно, компания планирует представить такую модель ускорителя. В любом случае, никаких деталей пока нет.

NVIDIA тестирует процессоры GP100 и GP104

Как мы недавно сообщали, компания NVIDIA занята внутренним тестированием новых графических процессоров с архитектурой Pascal. И благодаря очередной порции слухов стало известно, что GPU получили вполне традиционные названия — GP100 и GP104.

Несмотря на все ожидания использования стековой памяти, NVIDIA, по всей вероятности, пойдёт по пути AMD, предложив HBM2 лишь в топовой модели ускорителя. В остальных же будет использоваться наследная GDDR5 память с незамысловатым названием GDDR5X.

Графический процессор GP100 будет представлять собой хай-энд решение для профессионалов и энтузиастов, подобное нынешним версиями GTX 980 Ti или Titan. И именно этот процессор будет работать с гетерогенной памятью второго поколения, которая обеспечит шину интерфейса в 4096-бит, что при 1 ГГц частоты составит пропускную способность в невероятный терабайт на секунду.

Второй процессор, GP104, также расположится наверху линейки. Он будет использован в картах, которые заменят GTX 970 и 980. Вместе с этим GPU будет использована память GDDR5X с 256-битной шиной. В результате пропускная способность памяти составит 448 ГБ/с.

Как всегда, не стоит забывать, что всё это лишь слухи. С другой стороны, данный этап разработки GPU является идеальным для утечек данных, так что свежие сведения могут иметь под собой основания.