МИР NVIDIA / Анализ фактов и слухов о Rampage 

Анализ фактов и слухов о Rampage

23.10.2000


Вначале стоит отметить, что все, сказанное в этой статье - это предположения. Однако, предположения достаточно обоснованные. Rampage является, пожалуй, самым предсказуемым ускорителем из тех, которые готовятся к выходу в конце этого - начале следующего года. Это обусловлено, прежде всего, специфичностью архитектуры параллельной работы чипов - VSA, которая, по заявлениям 3dfx, будет использована и в Rampage.

Скорость заполнения и пропускная способность памяти

Главная проблема, которая ограничивает развитие ускорителей, это пропускная способность памяти. 3dfx разработала и использовала новую технологию, позволяющую в какой-то мере обойти это ограничение. Я говорю "в какой-то мере", потому что ее использование достаточно дорого, и добиться многократного прироста относительно других решений, сохраняя при этом конкурентоспособную цену, невозможно. Суть VSA в том, что на одной плате параллельно работают несколько чипов, и каждый имеет свою шину памяти. Благодаря этому пропускная способность памяти почти удваивается, но эффективный объем памяти делится почти на два. В результате 64Мб SDR памяти на Voodoo5 5500 имеет пропускную способность почти на уровне DDR, а эффективный объем памяти - всего около 32Мб. Из-за такой "не экономности", сохранить приемлемую цену можно, только используя относительно дешевую память. Зная все это, уже можно говорить о Rampage.

К моменту выхода Rampage, можно ожидать сильного падения цен на DDR SDRAM, работающей на невысоких частотах - 166-200МГц. С наибольшей вероятностью, 3dfx использует 200МГц DDR для своего нового ускорителя. А поскольку архитектура чипа должна соответствовать пропускной способности памяти, определить ее с достаточной вероятностью не трудно. DDR-память, с частотой 200МГц, может обеспечить чип, имеющий 4 блока текстурирования (TMU) и 2 или 4 конвейера. В результате, скорость VSA-200 (а именно так, вероятнее всего, и будет называться новый чип) будет быстрее своего предшественника почти в 2.5 раза. Что даст возможность играть с 4х FSAA и в достаточно высоких разрешениях, вроде 1024х768 на 2-х чиповой модели ускорителя.

Стоит также сказать пару слов о возможности установки на чип Rampage по 2-4 блока текстурирования на каждый конвейер. В принципе, технология 0.18мкм вполне позволяет это сделать. Но это был бы чисто маркетинговый шаг, реально не повышающий производительность, потому что пропускной способности памяти было бы совершенно недостаточно для такого чипа. Так что для нас практически нет ощутимой разницы между 1 блоком текстурирования на конвейер и двумя.

Производительность блока TCL

Ожидается также, что Rampage будет первым ускорителем 3dfx, который может рассчитывать трансформации, клиппинг и освещение аппаратно (то есть, будет иметь геометрический сопроцессор на борту - HW TCL).

Предполагается, что блок TCL будет выполнен в виде отдельного чипа с возможностью параллельного использования нескольких чипов. Пока трудно предположить, насколько эффективен будет удаленный от 3D-чипа TCL, возможно ли эффективно использовать одновременно несколько чипов. Но, несомненно, все эти факторы будут в большей или меньшей степени снижать эффективность его работы.

Самое распространенное мнение - что количество чипов TCL будет равно количеству чипов 3D. Однако, не исключен и выход, скажем, двухчиповой модели с одним чипом TCL. Возможен даже выход карт, не оснащенных блоком TСL вообще. Скорее всего, это будут удешевленные варианты для low-end рынка и OEM-only версии.

Пока трудно говорить о его производительности. Но, вероятно, каждый чип будет показывать производительность на уровне 50-60 млн. полигонов в секунду.

Также вызывает сомнение возможность установки на одну плату 4 различных чипа (2 текстурирующих и 2 блока TCL). Прежде всего из-за высокой сложности и, следовательно, стоимости такого решения.

Вообще, с блоком TCL пока очень много непонятного, и потому прогнозы можно делать только достаточно приблизительные.

Новые возможности

Прежде всего, без сомнения, в Rampage будет улучшенная поддержка мультисэмплинга (технология T-Buffer), которая позволяет, хоть и с потерей производительности, использовать многочисленные кинематографические эффекты вроде мягких теней, размытия движения и, конечно, полноэкранного сглаживания (Full Scene Anti-Aliasing). А также новые эффекты, недоступные на Voodoo 5. С выходом DX8 эта функция станет стандартом для всех будущих ускорителей всех фирм.

Также ходят слухи, что в новом ускорителе будет реализован очень гибкий программируемый конвейер рендеринга. Называется и имя - Texturing Computer. Вероятнее всего, подобные возможности также будут стандартом этого поколения, и они являются основным инструментом DirectX 8.0 для работы пиксельными шейдерами (Pixel Shaders). Это позволяет делать сложные эффекты освещения (кроме всего прочего - рельефное текстурирование, попиксельное освещение и пр). Напомню, аналогичный инструмент имеет GeForce (блок NSR), хотя, вероятно, в Rampage и NV20 он будет иметь гораздо более широкие возможности.

То есть, можно ожидать поддержку основных возможностей Direct3D 8.0, но 3dfx - это 3dfx и, скорее всего, они в очередной раз выпустят ускоритель, имеющий разумный минимум возможностей - и никаких излишеств. Например, 3D-текстуры вполне могут быть и не поддержаны в Rampage. Как "пока не нужные".

Проходил слух, что Rampage будет поддерживать ускорение вокселей, что позволит полноценно использовать и этот способ построения трехмерных изображений.

Итог

В итоге, мы получим рост производительности по сравнению с аналогичными моделями Voodoo5 в 2-2.5 раза, что позволит полноценно использовать качественное полноэкранное сглаживание (FSAA 4x) даже в высоких разрешениях вроде 1024х768х32 для двухчиповой модели. Скорее всего, Rampage будет иметь достаточно мощный блок TCL, чтобы можно было с отличной скоростью играть в игры нового поколения, имеющие по 100-200 тыс. полигонов в кадре. Некоторые поддержанные функции DX8 дадут увеличение качества в будущих играх, которых стоит ожидать где-нибудь через год после выхода ускорителя. Однако, весьма вероятно, многих перспективных на тот моменты функций в Rampage мы не увидим.

Предположительные спецификации ускорителя с одним чипом VSA-200

  • Fillrate 400 млн. пикселей в секунду и 800 млн. текселей в секунду в режиме битекстурирования [1]

  • 4-х конвейерная архитектура, 1 блок текстурирования на каждом конвейере

  • Техпроцесс 0.18мкм

  • Частота ядра 200МГц

  • Память DDR SDRAM на частоте 200 МГц

  • Пропускная способность памяти 6.4Гб в секунду.

  • Производительность аппаратного блока TCL от 40 до 60 миллионов полигонов в секунду.

  • Аппаратная установка до 32-х источников света

  • Пиксельные шейдеры

  • Поддержка основных возможностей DirectX 8.

Предположительные спецификации ускорителя с двумя чипами VSA-200

  • Fillrate 800 млн. пикселей в секунду и 1600 млн. текселей в секунду в режиме битекстурирования

  • 8-х конвейерная архитектура, 1 блок текстурирования на каждом конвейере

  • Техпроцесс 0.18мкм

  • Частота ядра 200МГц

  • Память DDR SDRAM на частоте 200 МГц

  • Пропускная способность памяти 12.8Гб в секунду.

  • Производительность аппаратного блока TCL от 80 до 120 миллионов полигонов в секунду.

  • Аппаратная установка до 64-х источников света

  • Пиксельные шейдеры

  • Поддержка основных возможностей DirectX 8.



Игорь Епимахов a.k.a. Sboy (sboy2@mail.ru)
Особая благодарность Quaz за помощь при подготовке статьи

[1] Битекстурирование - наложение на один пиксель двух текстур (текселей). Именно этот режим используется в подавляющем большинстве современных игр.