Новости про CUDA, Fermi и NVIDIA

EVGA выпускает GTX 480 SuperClocked+

Видеокарта представляет собой GTX 480 с заводским разгоном и улучшенной системой охлаждения.

EVGA заявляет, что GeForce GTX 480 SuperClocked+ холоднее до 7 градусов Цельсия, чем обычная GTX 480 SuperClocked, а частота ядра/шейдерного массива/памяти составляет соответственно 726/400/3800 МГц.

Имеются разъёмы Dual DVI, мини-HDMI и SLI; поддерживаются все современные API и технологии: PhysX, CUDA, 4-Way SLI, 3D Vision Surround, DirectX 11.

Цена видеокарты для предварительного заказа на веб-сайте EVGA составляет около 560 долларов. О комплектации изделия данных пока нет.

NVIDIA готовит конкурента Radeon HD 5970 в виде GeForce GTX 490 с двумя GPU

Слухи о возможном выпуске двухчипового ускорителя NVIDIA, построенного на базе архитектуры Fermi и способного конкурировать с нынешней «королевой видеокарт» ATI Radeon HD 5970, возникали на рынке еще до релиза адаптеров GeForce GTX 470 и GeForce GTX 480.

Не так давно, к примеру, мы сообщали в новостях, что компания из Санта-Клары действительно разрабатывает подобный продукт, однако в основе его окажется пара 40 нм чипов GF104, а не GF100, как в уже выпушенных решениях.

И вот теперь появились новые сведения о возможном двухчиповом адаптере NVIDIA из линейки GeForce GTX 400 под названием GeForce GTX 490. Согласно им, производитель может представить такую видеокарту на выставке Computex 2010, открывающейся в начале июня. Причем, эта демонстрация пройдет за закрытыми дверями, а приглашены на нее будут лишь самые важные партнеры компании.

Что касается характеристик предполагаемой графической карты GeForce GTX 490, то есть информация, что она действительно получит два GPU, причем, в их роли выступит версия чипа GF100, используемая в модели GeForce GTX 470 (то есть с 448 ядрами CUDA). Причем, показатель TDP нового «графического монстра» не должен превышать отметки примерно 375 ватт. Учитывая, что референсная версия GeForce GTX 470 обладает TDP в 215 ватт, для достижения указанного рубежа, вероятнее всего, придется пойти на снижение тактовой частоты видеопроцессора.

Выход NVIDIA GeForce GTX 480 и GTX 470 состоялся

Событие, которое так долго ждали энтузиасты и рядовые игроки всего мира, и которое неоднократно откладывалось, наконец, свершилось: официальный выход на рынок графических ускорителей NVIDIA нового поколения состоялся. Встречаем GeForce GTX 480 и GTX 470.

Обе видеокарты используют самый сложный графический чип из когда-либо созданных, насчитывающий около трёх миллиардов транзисторов. По сравнению с предыдущим поколением графическая производительность увеличена в 2 раза, произведена коренная переработка архитектуры с учётом современных требований к графическим ускорителям: хотя  графика остаётся приоритетной областью применения GPU, возрастает роль видеокарт в качестве высокопараллельного процессора общего назначения. Fermi стал гораздо более походить на CPU, получив полноценную иерархию кэш-памяти и возможность более удобной работы с различными окружениями.

Нельзя забывать и о полной поддержке DirectX 11 и о внедрении движка PolyMorph, обеспечивающего высокую производительность в новом методе тесселяции. Видеокарты GTX 480 и GTX 470 стали эффективнее исполнять физические эффекты PhysX и обзавелись поддержкой технологии NVIDIA 3D Vision Surround (в комбинациях SLI), позволяющей погрузиться в игровой мир благодаря стереоскопическому режиму на трёх мониторах.

Существенно переработан геометрический конвейер для увеличения производительности геометрических шейдеров, вывода потока и операций отсечения полигонов. Благодаря улучшенному сжатию данных в блоках растровых операций, возросла производительность требовательного метода 8-кратного полноэкранного сглаживания MSAA. Переработке подверглись и текстурные блоки для большей эффективности и улучшенной производительности в игровых приложениях.

Итак, официальные характеристики новых ускорителей:

 GeForce GTX 470 GeForce GTX 480
Кластеры обработки графики44
Потоковые мультипроцессоры14 (из 16 на кристалле)15 (из 16 на кристалле)
Ядра CUDA448480
Текстурные блоки5660
Блоки растровых операций4048
Частота ядра607 МГц700 МГц
Частота процессоров CUDA1215 МГц1401 МГц
Частота памяти / эффективная частота837 МГц / 3348 МГц924 МГц / 3696 МГц
Объём видеопамяти1280 Мб1536 Мб
Интерфейс памяти320 бит384 бит
Пропускная способность памяти133,9 Гб/с177,4 Гб/с
Скорость текстурной фильтрации (билинейная)34 Гигатекселей/с42 Гигатекселей/с
Техпроцесс40 нм40 нм
Видеовыходы2 x Dual-Link DVI-I 1 x Mini HDMI2 x Dual-Link DVI-I 1 x Mini HDMI
ИсполнениеДвухслотовоеДвухслотовое
Разъёмы доп. питанияДва 6-контактных6- и 8-контактный
Макс. энергопотребление215 Вт250 Вт
Рекомендуемый блок питания550 Вт600 Вт
Типичная раб. температура GPU105° C105° C
Рекомендуемая цена350 $500 $

В доказательство того, что её новые ускорители GTX 480 и GTX 470 наголову превосходят прямых конкурентов в лице ATI Radeon HD 5870 и HD 5850, компания NVIDIA предоставила следующие тесты, проведённые в своей лаборатории на системе с процессором Core i7 @3,2 ГГц, ОС Windows Vita. При тестировании использовались драйверы GeForce 197.17 и Catalyst 10.2.

Второе сравнение  отражает соотношение производительности одночиповых флагманов обеих компаний. К сожалению, в тестировании не принимает участие Crossfire-конфигурация HD 5870.

Релиз CUDA Toolkit 3.0

К выходу Fermi — новая версия инструментов CUDA для разработчиков.

В CUDA 3.0 сделаны значительные изменения:

  • поддержка новой архитектуры Fermi;
  • поддержка классов C++;
  • взаимодействие CUDA и OpenCL с Direct3D 9/10/11 и OpenGL;
  • возможность использования в одном приложении и CUDA Runtime, и CUDA Driver API.
  • многократное повышение производительности при отладке в cuda-dbg и аппаратное ускорение отладки для CUDA Driver API на видеокартах с архитектурой Fermi;
  • утилита CUDA Memory Checker для поиска ошибок выравнивания данных и переполнения памяти;
  • ряд важных улучшений в OpenCL.

Загрузить CUDA SDK, документацию и отладочные драйверы для Windows, Linux и MacOS можно со специальной страницы сайта NVIDIA для разработчиков.

Технологическое видео NVIDIA с GDC 2010 — симуляция волосяного покрова

Для демонстрации вычислительной мощности NVIDIA Fermi был выбран крепкий орешек трёхмерной графики.

Имитация волос и причёски — одна из самых сложных задач для CGI-графики в кино и играх, недаром «компьютерный» Горлум во «Властелине колец» был абсолютно лыс, а компьютерные же На`Ви в «Аватаре» были сплошь поклонниками заплетения волос в «дреды». На прошедшей GDC 2010 NVIDIA показывала свое решение проблемы: CUDA для расчётов 18 тыс. волос, DirectX 11 для точного их рендеринга, и всё это на GPU Fermi.

Результат даже такой передовой «кремниевой» технологии, признаться, всё еще далёк от технологии органической. Быть может, в следующем поколении «железа»…

NVIDIA Simulating Realistic Hair - Amazing Techdemo

CUDA 3.0 — уже с поддержкой Fermi

Cтал публично доступен CUDA Toolkit 3.0 Beta, позволяющий помимо прочего присмотреться к грядущей архитектуре NVIDIA Fermi.

В форуме NVIDIA для разработчиков опубликованы ссылки на документацию и средства разработки для новой версии 3.0 API CUDA. Основными новшествами являются:

  • CUDA driver API и Runtime API можно использовать одновременно;
  • многочисленные улучшения по отладке, проверке выхода массива за размер и т.п.;
  • поддержка классов С++;
  • взаимодействие с DirectX 11 и OpenGL;
  • версионирование библиотек, из приложения можно проверять версию рантайма и с этим работать;
  • предварительная поддержка перспективной архитектуры NVIDIA Fermi;
  • многочисленные улучшения в поддержке OpenCL.

К сожалению, основная масса документации пока представляет собой всё те же документы по CUDA 2.3. Для практической работы с CUDA 3.0 требуются драйверы 195.39 (Windows)/195/17 (Linux), также выложенные на форуме NVIDIA.