Новости про Clarkdale и Intel

Документация и советы по повышению производительности Intel для графики Sandy Bridge

Советы для разработчиков игр: как выжать максимум из графического ядра процессоров Sandy Bridge и слово одобрения от Valve.

С выходом нового поколения интегрированных графических решений Intel традиционно прилагает определённые усилия по разъяснению разработчикам игр всех преимуществ, великолепной производительности и лучшего в отрасли качества графики своих IGP. Ну или хотя бы успокоить и объяснить, что жить с IGP можно, особенно если знать, как его правильно готовить.

Первым в списке идёт сравнительная таблица решений HD Graphics предыдущего (Clarkdale) и нынешнего (Sandy Bridge) поколений. Из неё можно узнать, что:

  • новые IGP поддерживают Direct3D 10.1 и OpenGL 3.0, (хотя выпускать в 2011 году решения с технологиями образца 2008 года приличествует лишь аутсайдерам вроде VIA) против 10.0/2.1 у Clarkdale;
  • шейдерные блоки (EU в терминологии Intel) теперь работают на частотах до 1350 МГц против 900 МГц ранее (хотя забывают упомянуть, что такие цифры достижимы лишь с авторазгоном Turbo Boost при условии, что основная часть процессора не сильно нагружена, что в случае игр бывает не каждый день)
  • в часть новых процессоров этих самых EU еще и не доложили, бывает 6 вместо 12;
  • имеется полное ускорение видеодекодирования, к которому добавилось и ускорение кодирования видео, но не через OpenCL или DirectCompute, а через Intel Media SDK;
  • поддерживается воспроизведение Blu-ray 3D на стереоустройства, подключаемые по HDMI 1.4, но для стерео в играх пока ничего не предлагается.

Далее идёт довольно объёмистое руководство по оптимизации производительности графики для Sandy Bridge, с практическими рекомендациями для DirectX и использования инструментов оптимизации самой Intel. Руководство подкрепляется практическим примером «Как увеличить производительность в четыре раза» для использующей Direct3D 10 симуляции водной поверхности Ocean Fog. Метод увеличения оказался на удивление прост — проанализировать загрузку GPU с помощью инструментов Intel GPA, после чего прибегнуть к тотальному уменьшению размеров текстур и карт нормалей. В итоге удалось одержать победу по среднему времени кадра над графическим решением NVIDIA Quadro FX 570M, правда, лишь в цифрах после запятой.

Более интересный пример оптимизации — технология переноса генерации карт теней с GPU на CPU под названием Onloaded Shadows. Название не случайно — когда-то, во времена DirectX 8 эта задача была снята с CPU (offloaded) в пользу шейдеров на GPU. С помощью программного рендера WARP, входящего в состав DirectX 11 и поддерживающего полный функционал Direct3D 10, на CPU запускается параллельный рендеринг сцены, просчитывающий карты теней, которые складируются в примапленный ресурс, из которого затем забираются GPU для помещения в основную сцену. Разработчики также поиграли с различными схемами синхронизации обмена между потоками.


 Результаты оказались весьма интересными — производительность интегрированного видео выросла в несколько раз в сравнении с полной обработкой на GPU. Не первой свежести видеокарта в лице Quadro FX 770M тоже смогла получить некоторое преимущество при определённом методе синхронизации потоков. Однако, для современного решения в лице AMD Radeon HD 5870 игры с программным рендерингом пошли только во вред — они лишь отвлекали CPU от основной задачи скармливания всё новых данных монстру графической производительности. Саму демонстрацию можно загрузить с сайта Intel.

Не забыты оказались и конечные пользователи. Специально для них корпорация подготовила уникальный для второго десятилетия XXI века документ под названием «Список игр, работающих на интегрированном видео Sandy Bridge». Такие списки, помнится, были популярны на заре технологий 3D-ускорения лет двенадцать-пятнадцать назад, когда каждый производитель графических решений поддерживал собственный API трёхмерной графики. В любом случае, приятно видеть, что число игр возросло в сравнении с аналогичным списком для предыдущего поколения HD Graphics, правда, почти половину записей в нём составляют малоизвестные (у нас) ММО-игры из Азии.

Тем временем, как сообщает портал Gamasutra, руководитель Valve Gabe Newell высоко отозвался о новом продукте Intel, заявив в частности, что Sandy Bridge поставит ПК вровень с игровыми консолями (It's a real game changer for us. This allows for a console like experience on the PC). Видимо, в Valve еще не прочитали уже упомянутое руководство по оптимизации производительности графики, потому как очевидно, что 200+ GFLOPS графических процессоров консолей никак не равны 125 GFLOPS (и то с учётом TurboBoost) Sandy Bridge IGP из данного документа. Или глава Valve под консолями имел ввиду Nintendo Wii?

Напоследок несколько видео от Intel, демонстрирующих графику Sandy Bridge в деле (внимания заслуживает технология беспроводного подключения HD-дисплея).

Процессоры Intel переходят на новый степпинг

Intel официально анонсировала перевод трёх десктопных процессоров, выпускаемых по 32-нм технологии (Clarkdale) на новый степпинг K0.

Эти «счастливчики» — i3-530 с частотой 2.93 ГГц , i3-540 (3.06 ГГц) и i5-650 (3.2 Ггц) будут постепенно переведены с текущего степпинга C2 на новый K0 в течение следующего месяца.

Новый степпинг характеризуется:

  • новыми номерами S-spec и MM;
  • новым Extended CPUID (0x00020655);
  • новым Host RevID (0x18);
  • добавлением поддержки Processor Context ID (PCID).

Разумеется, новинки потребует от вас обновления BIOS, чтобы быть узнанными вашими системными палатами.

Первые чипы с K0 ожидаются с 16-го октября.

Intel Graphics Performance Analyzers 3.0

Средства отладки графической части игр от Intel.

Graphics Performance Analyzers от Intel представляет собой комплект средств для отладки графических приложений, аналогичный NVIDIA PerfKit. Можно в реальном времени отследить затраты времени на отрисовку определённых частей изображения, загрузку основных блоков GPU и видеопамяти. GPA в первую очередь создан как средство оптимизации графики под весьма скромные возможности интегрированных в чипсеты и процессоры IGP от самой Intel, но большинство функций работают независимо от видеокарты.

В новой версии сделано множество изменений:

  • предварительная версия средства отладки Intel Platform View для быстрого поиска узких мест и отладки многопоточных приложений;
  • новые счётчики производительности для Intel HD Graphics в процессорах Core i с архитектурой Arrandale и Clarkdale;
  • отладка 64-битных приложений;
  • отладка DirectX 10.1 рендеринга;
  • новый интерфейс соединения приложений с System Analyzer в Windows Vista и 7;
  • анализ производительности шейдеров;

В качестве демонстрации Intel опубликовала видео с прошедшей GDC 2010, в котором сотрудники студии Firaxis рассказали об использовании Intel Graphics Performance Analyzers в разработке игры Civilization 5.

Инструменты GPA от Intel распространяются бесплатно, достаточно зарегистрироваться на официальном сайте.

Краткие итоги тестов графического ядра Intel Clarkdale

После снятия запрета на публикации о новом процессорном ядре Clarkdale от Intel сеть заполонили результаты тестов и бенчмарков. Обобщение некоторых результатов.

Изучению подверглись обзоры новых процессоров на не нуждающихся в отдельном представлении сайтах AnandTech, Tom`s Hardware и TechPowerUp. Все три сайта тестировали одну и ту же модель процессора Core i5 за номером 661 с частотой 3,33 ГГц, вторую сверху по рангу в новой линейке Intel.

Тесты производительности показали, что интеграция графического ядра в процессор, пусть и в значительной степени «виртуальная», как и увеличение числа шейдерных процессоров с 10 до 12 определенно пошли на пользу: во многих тестах удалось вплотную приблизиться к результатам интегрированной графики от AMD, не говоря уже о почти двухкратном опережении предыдущей платформы G45.

Впрочем, даже в онлайн играх вроде World of Warcraft или стратегиях вроде Warhammer: Dawn of War 2 средний FPS лишь с трудом можно назвать приемлемым. Производительность даже начальных графических карт, таких как GeForce 210 или Radeon 4550, по-прежнему остается недостижимым идеалом, и это для почти топового процессора с максимальной частотой графического ядра. Результаты младших моделей ожидаемо оказались еще ниже.

Все обозреватели столкнулись с многочисленными проблемами с качеством графики. На AnandTech отмечают, что для достижения сколь-либо играбельной производительности качество графики в играх приходится понижать до уровня времен Playstation 2. На TechPowerUp столкнулись с многочисленными артефактами изображения и полным отсутствием FSAA. Но меньше всех повезло обозревателям Tom`s Hardware — им не удалось получить изображение не только в «классическом» Crysis или новой DiRT 2, но и в использующем предпенсионного возраста движок Source многопользовательском шутере Left 4 Dead 2.

Качество графики в World of Warcraft:

Качество графики в Dragon Age: Origins:

В целом, новое графическое ядро Intel, хотя и поставило «родную» платформу вровень с достижениями платформ AMD и NVIDIA в вопросах производительности, оставляет странное впечатление. Нет ни поддержки DirectX 11, или хотя бы 10.1, ни OpenGL 3.x, хотя AMD и NVIDIA достаточно давно сделали поддержку OpenGL 3.0 в том числе и для интегрированных решений. Поддержки универсальных вычислений OpenCL, судя по всему, ждать от Intel тоже не приходится, а богатые возможности по декодированию  и выводу видео смазываются непонятной урезанностью этих функций в чипсете H55 по сравнению с H57. На этом фоне уже не так удивляет поддержка дисплеев высокого разрешения только через всё еще редкий интерфейс DisplayPort — DVI и HDMI ограничены полосой Single-Link.

Очередные данные о быстродействии графического ядра Clarkdale

На этот раз появились данные по быстродействию самого младшего представителя Clarkdale — Pentium G6950.

Источником данных послужило китайское печатное издание, опубликовавшее результаты тестирования системы Intel Pentium G6950 + материнская плата на базе чипсета H55 в сравнении с системами на Core 2 E6550 с чипсетами Intel G41, G45 и GeForce 9300. Следует отметить, что в отличие от основной линейки процессоров Core i3 на базе ядра Clarkdale, чья официальная продажа начнется лишь 7 января, процессор начального уровня Pentium G6950 уже представлен в некоторых регионах, и даже упомянут в китайском сегменте сайта Intel. Однако, нельзя утверждать, что тестировались конечные продукты, а не инженерные образцы, так как на сайте Intel для данной модели заявлена частота в 2,8 ГГц, а в тестировании участвовал процессор с частотой 2,53 ГГц.

Результаты тестирования особых сюрпризов не содержат. Графическое ядро Clarkdale содержит лишь на два шейдерных блока больше, чем предшественник X4500, использовавшееся в G45, итого 12 в сравнении с 16 SPU у GeForce 9300, а конкретно в Pentium G6950 оно еще и работает на частоте лишь в 533 МГц. Побить платформу NVIDIA с учетом этих особенностей ожидаемо не удалось, а преимущество над предыдущими платформами самой Intel обеспечено скорее использованием более быстрой оперативной памяти DDR3. Врядли что-либо изменится принципиально с выходом старших моделей Clarkdale — частота в 800 МГц и динамический разгон Turbo Boost, а не совершенство архитектуры позволят немного улучшить данные результаты. Напомним, что Intel не удалось окончательно интегрировать графическое ядро в процессор — лишь разместить отдельный кристалл вместе с CPU на одной подложке.

Цена самого простого процессора Clarkdale

Перечень первых процессоров Clarkdale, которые Intel намерена выпустить в конце этого года, уже известен, и мы его приводили с указанием основных характеристик. Недавно стала известна цена самого дешевого решения — Pentium G6950

Она составляет 84 $. Процессор имеет 2 вычислительных 32-нм ядра x86 с частотой 2,8 ГГц и встроенный 45-нм графический ускоритель, располагает 3 Мб кэш-памяти. Технология Hyper-Threading отсутствует. Чип предназначен для контактной площадки LGA 1156. Однако, он не будет работать на материнских платах с чипсетом P55 для Core i5, потребуется новый набор системной логики. Возможно, это будет H57.

Встроенное видеоядро Core i5 будет работать на частоте до 900 МГц

Судя по планам Intel, попавшим в сеть, самым быстрой моделью в 600 серии Core i5 будет двуядерный процессор Core i5-670 (3,46 ГГц), однако не этот чип будет обладать самым быстрым встроенным видеоядром в линейке.

Пока известно о 4 процессорах в серии Core i5-600: Core i5-670/661/660/650. При этом модели Core i5-670/660/650 будут иметь видеочип с частотой 733 МГц при энергопотреблении не выше 73 Вт, в то же время Core i5-661 будет оснащен графическим процессором с частотой 900 МГц, а его энергопотребление составит 87 Вт.

Core i5-661 по сравнению с Core i5-660 не поддерживает улучшенные возможности виртуализации Intel VT-D и средства аппаратной защиты TXT от исполнения вредоносного кода, а в остальном является тем же продуктом: частота ядра 3,33 ГГц, 4Мб кэш-памяти L3, 2 ядра и 4 потока, поддержка TurboBoost.

Westmere будет показан на IDF 2009

Процессор Core i3 540 @3,06 ГГц под кодовым именем Clarkdale уже попал в руки некоторых обозревателей, которые не только оценили его производительность в различных приложениях в сравнении с более медленным Core 2 Duo E8400, но и провели разгон на штатной системе охлаждения, доказав, что процессор обладает весьма высоким частотным потенциалом — более 4 ГГц.

Однако, нам до сих пор не представили сведения о производительности главной составляющей новой архитектуры Westmere — встроенного графического ядра.

Какова же эффективность нового подхода, возможно, мы сможем узнать на грядущем Форуме разработчиков Intel, который пройдет с 22 по 24 сентября в Сан-Франциско.

Уже известен модельный ряд из шести первых процессоров Clarkdale, их рыночные имена, характеристики и ценовая ниша от 100 до 143 $, которую они займут, — об этом мы писали раньше. Напомним, что процессоры будут продаваться под именами Core i5, Core i3, и Pentium G.

Core i5 — это наиболее совершенные решения: 4 модели серии 6×0 будут иметь частоту от 3,2 до 3,43 ГГц, а также возможность автоматического увеличения частоты одного ядра благодаря технологии Turbo Boost, будут обладать 4 Мб кэш-памяти, двухканальным контроллером DDR3, возможностью Hyper-Threading для выполнения двух потоков команд на ядро.

Две известные модели Core i3 серии 5×0 обладают более низкими частотами: 2,93 и 3,06 ГГц, у них также отсутствует поддержка Turbo Boost. Pentium G6950 работает на частоте 2,8 ГГц, объем его кэш-памяти ограничен 3 Мб, также отсутствует поддержка Hyper-Threading и Turbo Boost.

Intel ожидает, что число поставок Clarkdale составит 8 % ко времени выхода в конце года, а затем возрастет до 19 % от общих поставок настольных процессоров Intel.

Модельные номера процессоров Intel Lynnfield и Clarkdale

Остаются считанные недели до того, как Intel выведет на рынок процессоры, построенные на основе удешевленной архитектуры Nehalem Lynnfield, предназначенные для разъема LGA-1156. С сети появились данные о модельных номерах новых процессоров, опубликованные сайтом IT168.

Таким образом, из 4-ядерных решений ожидается выход 5 моделей:

  1. Core i7 870 @2,93 ГГц.
  2. Core i7 860 @2,8 ГГц.
  3. Core i5 750 @2,66 ГГц.
  4. Core i7 860s @2,53 ГГц (энергоэффективный).
  5. Core i5 750s @2,4 ГГц (энергоэффективный).

Все перечисленные чипы обладают 8 Мб кэш-памяти L3 и поддержкой памяти DDR3 1333 МГц и 1066 МГц. Технология Hyper-Threading отсутствует только у моделей семисотой серии. Из того же источника стали также известны и рыночные имена процессоров Clarkdale, объединяющих два 32-нм x86-ядра и одно 45-нм графическое ядро. Выход этих решений запланирован на начало следующего года. Данная архитектура, как уже стало известно, не ограничится торговой маркой Core i3, а займет также Core i5 и Pentium G. Линейка будет выглядеть следующим образом:

  1. Core i5 670 @3,43 ГГц, с Turbo Boost — 3,73 ГГц.
  2. Core i5 660 @3,33 ГГц, с Turbo Boost — 3,60 ГГц.
  3. Core i5 650 @3,20 ГГц, с Turbo Boost — 3,43 ГГц.
  4. Core i3 540 @3,06 ГГц.
  5. Core i3 530 @2,93 ГГц.
  6. Pentium G6950 @2,8 ГГц.

Все вышеуказанные модели серии Core обладают по 256 кб L2 на каждое ядро и 4 Мб кэш-памяти L3, а также имеют следующие возможности, присущие архитектуре Nehalem:

  • Встроенный 2-канальный контроллер памяти DDR3 1333/1066 МГц
  • Технология Turbo Boost, увеличивающая частоту одного ядра при максимальной загруженности.
  • Технология Hyper-Threading, обеспечивающая одновременную обработку двух задач одним ядром.
  • Набор аппаратных средств Intel Trusted eXecution Technology (TXT), увеличивающих безопасность.
  • Улучшенные возможности виртуализации VT-d.

Процессор Pentium G6950 отличается меньшим объемом кэш-памяти L3 (3 Мб) и отсутствием Hyper-Threading. Энергопотребление всех процессоров Clarkdale будет довольно высоким из-за встроенного видеоядра и составит 73 Вт. Стоимость моделей Core i3 будут находиться в диапазоне от 123 до 143 $, а 2-ядерных решений Core i5 — от 176 до 284 $. Pentium G6950 будет продаваться по цене ниже 100 $.

Можно отметить, что Clarkdale будет весьма дорогим предложением для тех, кто не привык экономить. Однако, заинтересуют ли эти процессоры данную категорию людей, остается под вопросом.

Тестирования процессора Intel Clarkdale

Как известно, в начале следующего года Intel выпустит первый в мире x86-процессор со встроенным видеодяром. Чип под кодовыми именем Clarkdale состоит из 45-нм графического ускорителя и двух 32-нм ядер, основаных на архитектуре Nehalem с поддержкой технологии Hyper-Threading, что позволят ему обрабатывать до 4 задач одновременно. В продажу он поступит под именем Core i3.

Недавно первый образец Clarkdale с частотой 3,06 ГГц и 4 Мб кэш-памяти L3 попал в руки различных обозревателей и энтузиастов. Как выяснилось, при штатном напряжении и заводской системе охлаждения процессор удалось разогнать до 4 ГГц при сохранении стабильной работы.

Теперь в сети появился краткий обзор тайваньского сайта IT168, в котором была проведена оценка производительности Core i3 (Clarkdale) в сравнении с Core 2 Duo E8400 (Wolfdale), обладающего 6 Мб памяти L3 и работающего на такой же частоте.

 

В результате выяснилось, что в реальных игровых приложениях производительность отличается незначительно, в синтетических же тестах можно отметить заметный прирост производительности в пропускной способности памяти благодаря встроенному в Core i3 контроллеру, гигантская разница наблюдается и в скорости AES-шифрования. Таким образом, на лицо очевидные преимущества архитектуры Nehalem. К сожалению, мы так и не получили наиболее интересные данные — результаты тестирования встроенного графического ядра. Хотелось бы узнать, какие преимущества дает новый подход и насколько они важны. Что касается энергопотребления, то у Clarkdale оно на 6—10 Вт ниже, чем у Core 2 Duo E8400. При этом, TDP последнего равно 65 Вт. Наконец, вопрос цены, и он не может порадовать покупателей. По сведениям сайта HEXUS, вышеуказанная модель Core i3 будет продаваться по цене 143 $. В настоящее время E8400 продается в американских Интернет-магазинах за 168 $, к началу следующего года цена, безусловно, будет ниже. Так что Core i3 просто заменит Core 2 Duo, не становясь при этом более выгодным предложением.