Документация и советы по повышению производительности Intel для графики Sandy Bridge
Советы для разработчиков игр: как выжать максимум из графического ядра процессоров Sandy Bridge и слово одобрения от Valve.
С выходом нового поколения интегрированных графических решений Intel традиционно прилагает определённые усилия по разъяснению разработчикам игр всех преимуществ, великолепной производительности и лучшего в отрасли качества графики своих IGP. Ну или хотя бы успокоить и объяснить, что жить с IGP можно, особенно если знать, как его правильно готовить.
Первым в списке идёт сравнительная таблица решений HD Graphics предыдущего (Clarkdale) и нынешнего (Sandy Bridge) поколений. Из неё можно узнать, что:
- новые IGP поддерживают Direct3D 10.1 и OpenGL 3.0, (хотя выпускать в 2011 году решения с технологиями образца 2008 года приличествует лишь аутсайдерам вроде VIA) против 10.0/2.1 у Clarkdale;
- шейдерные блоки (EU в терминологии Intel) теперь работают на частотах до 1350 МГц против 900 МГц ранее (хотя забывают упомянуть, что такие цифры достижимы лишь с авторазгоном Turbo Boost при условии, что основная часть процессора не сильно нагружена, что в случае игр бывает не каждый день)
- в часть новых процессоров этих самых EU еще и не доложили, бывает 6 вместо 12;
- имеется полное ускорение видеодекодирования, к которому добавилось и ускорение кодирования видео, но не через OpenCL или DirectCompute, а через Intel Media SDK;
- поддерживается воспроизведение Blu-ray 3D на стереоустройства, подключаемые по HDMI 1.4, но для стерео в играх пока ничего не предлагается.
Далее идёт довольно объёмистое руководство по оптимизации производительности графики для Sandy Bridge, с практическими рекомендациями для DirectX и использования инструментов оптимизации самой Intel. Руководство подкрепляется практическим примером «Как увеличить производительность в четыре раза» для использующей Direct3D 10 симуляции водной поверхности Ocean Fog. Метод увеличения оказался на удивление прост — проанализировать загрузку GPU с помощью инструментов Intel GPA, после чего прибегнуть к тотальному уменьшению размеров текстур и карт нормалей. В итоге удалось одержать победу по среднему времени кадра над графическим решением NVIDIA Quadro FX 570M, правда, лишь в цифрах после запятой.
Более интересный пример оптимизации — технология переноса генерации карт теней с GPU на CPU под названием Onloaded Shadows. Название не случайно — когда-то, во времена DirectX 8 эта задача была снята с CPU (offloaded) в пользу шейдеров на GPU. С помощью программного рендера WARP, входящего в состав DirectX 11 и поддерживающего полный функционал Direct3D 10, на CPU запускается параллельный рендеринг сцены, просчитывающий карты теней, которые складируются в примапленный ресурс, из которого затем забираются GPU для помещения в основную сцену. Разработчики также поиграли с различными схемами синхронизации обмена между потоками.
Результаты оказались весьма интересными — производительность интегрированного видео выросла в несколько раз в сравнении с полной обработкой на GPU. Не первой свежести видеокарта в лице Quadro FX 770M тоже смогла получить некоторое преимущество при определённом методе синхронизации потоков. Однако, для современного решения в лице AMD Radeon HD 5870 игры с программным рендерингом пошли только во вред — они лишь отвлекали CPU от основной задачи скармливания всё новых данных монстру графической производительности. Саму демонстрацию можно загрузить с сайта Intel.
Не забыты оказались и конечные пользователи. Специально для них корпорация подготовила уникальный для второго десятилетия XXI века документ под названием «Список игр, работающих на интегрированном видео Sandy Bridge». Такие списки, помнится, были популярны на заре технологий 3D-ускорения лет двенадцать-пятнадцать назад, когда каждый производитель графических решений поддерживал собственный API трёхмерной графики. В любом случае, приятно видеть, что число игр возросло в сравнении с аналогичным списком для предыдущего поколения HD Graphics, правда, почти половину записей в нём составляют малоизвестные (у нас) ММО-игры из Азии.
Тем временем, как сообщает портал Gamasutra, руководитель Valve Gabe Newell высоко отозвался о новом продукте Intel, заявив в частности, что Sandy Bridge поставит ПК вровень с игровыми консолями (It's a real game changer for us. This allows for a console like experience on the PC). Видимо, в Valve еще не прочитали уже упомянутое руководство по оптимизации производительности графики, потому как очевидно, что 200+ GFLOPS графических процессоров консолей никак не равны 125 GFLOPS (и то с учётом TurboBoost) Sandy Bridge IGP из данного документа. Или глава Valve под консолями имел ввиду Nintendo Wii?
Напоследок несколько видео от Intel, демонстрирующих графику Sandy Bridge в деле (внимания заслуживает технология беспроводного подключения HD-дисплея).