Experience high definition worlds, lifelike characters, and forces of nature so powerful that your palms sweat and your heart races with every frame. Beyond games, watch Blu-ray movies and transcode video up to 7X faster than traditional CPUs 1 .
GEFORCE GTX 200 GPUs | GAMING BEYOND | BEYOND GAMING | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Introducing NVIDIA GeForce GTX 280 and GeForce GTX 260
NVIDIA talks with developers about GeForce GTX 200 performance for their games
|
NVIDIA GeForce GTX 200 GPUs take gaming and effects beyond levels previously seen before
Medusa demo by NVIDIA and NVIDIA® PhysX™ Technology, and NaturalMotion.
|
More than just games - NVIDIA GeForce GTX 200 GPUs accelerate the latest consumer applications
1 The GeForce GTX 280 GPU ships with hardware support for NVIDIA PhysX technology. NVIDIA PhysX drivers are required to experience in-game GPU PhysX acceleration. Refer to for more information. Note: The below specifications represent this GPU as incorporated into NVIDIA"s reference graphics card design. Graphics card specifications may vary by Add-in-card manufacturer. Please refer to the Add-in-card manufacturers" website for actual shipping specifications. GPU Engine Specs:
Memory Specs:
Feature Support:
Display Support:
Standard Graphics Card Dimensions:
Thermal and Power Specs:
The number of processor cores may vary by model. |
Наиболее производительным одночиповым решением доселе являлся GeForce GTX 280 - обладает 240 шейдерными процессорами, 80 текстурными процессорами, поддерживает до 1 Гб видеопамяти. Фактически современное графическое ядро семейства GeForce GTX 200 можно представить как универсальный чип, поддерживающий два разных режима – графический и вычислительный. Архитектуру чипов семейств GeForce 8 и 9 обычно представляют массивами масштабируемых процессоров (Scalable Processor Array, SPA). Архитектура чипов семейства GeForce GTX 200 основана на доработанной и улучшенной архитектуре SPA, состоящей из ряда так называемых "кластеров обработки текстур" (TPC, Texture Processing Clusters) в графическом режиме или "кластеров обработки потоков" в режиме параллельного вычисления.
При этом каждый модуль TPC состоит из массива потоковых мультипроцессоров (SM, Streaming Multiprocessors), и каждый SM содержит восемь процессорных ядер, также называемых потоковыми процессорами (SP, Streaming Processor), или тредовыми процессорами (TP, Thread Processor). Каждый SM также включает в себя процессоры текстурной фильтрации для графического режима, также используемый для различных операций фильтрации в вычислительном режиме.
Ниже представлена блок-схема GeForce 280 GTX в традиционном графическом режиме.
Переключаясь в вычислительный режим, аппаратный диспетчер потоков (вверху) управляет тредами TPC.
Кластер TPC при ближайшем рассмотрении: распределённая память для каждого SM; каждое процессорное ядро SM может распределять данные между другими ядрами SM посредством распределённой памяти, без необходимости обращения к внешней подсистеме памяти.
Таким образом, унифицированная шейдерная и компьютерная архитектура NVIDIA использует две совершенно разные вычислительные модели: для работы TPC используется MIMD (multiple instruction, multiple data), для вычислений SM - SIMT (single instruction, multiple thread), продвинутая версия, SIMD (single instruction, multiple data).
Касаясь общих характеристик, по сравнению с предшествовавшими поколениями чипов семейство GeForce GTX 200 обладает следующими преимуществами:
Возможность обработки втрое большего количества потоков данных в единицу времени
Новый дизайн планировщика выполнения команд, с повышенной на 20% эффективностью обработки текстур
512-битный интерфейс памяти (384 бита у предыдущего поколения)
Оптимизированный процесс z-выборки и компрессии для достижения лучших результатов производительности при высоких разрешениях экрана
Архитектурные усовершенствования для увеличения производительности при обработке теней
Полноскоростной блендинг буфера кадров (против полускоростного у 8800 GTX)
Вдвое увеличенный буфер команд для повышения производительности вычислений
Удвоенное количество регистров для более оперативного обсчёта длинных и сложных шейдеров
Удвоенная точность обсчета данных с плавающей запятой в соответствии со стандартом версии IEEE 754R
Аппаратная поддержка 10-битного цветового пространства (только с интерфейсом DisplayPort)
Так выглядит список основных характеристик новых чипов:
Поддержка NVIDIA PhysX
Поддержка Microsoft DirectX 10, Shader Model 4.0
Поддержка технологии NVIDIA CUDA
Поддержка шины PCI Express 2.0
Поддержка технологии GigaThread
Движок NVIDIA Lumenex
128-битные вычисления с плавающей запятой (HDR)
Поддержка OpenGL 2.1
Поддержка Dual Dual-link DVI
Поддержка технологии NVIDIA PureVideo HD
Поддержка технологии NVIDIA HybridPower
Отдельно отмечено, что DirectX 10.1 семейством GeForce GTX 200 не поддерживается. Причиной назван тот факт, что при разработке чипов нового семейства, после консультаций с партнёрами, было принято сконцентрировать внимание не на поддержке DirectX 10.1, пока мало востребованного, а на улучшении архитектуры и производительности чипов.
Основанная на пакете физических алгоритмов, реализация технологии NVIDIA PhysX представляет собой мощный физический движок для вычислений в реальном времени. В настоящее время поддержка PhysX реализована в более чем 150 играх. В сочетании с мощным GPU, движок PhysX обеспечивает значительное увеличение физической вычислительной мощи, особенно в таких моментах как создание взрывов с разлётом пыли и осколков, персонажей со сложной мимикой, новых видов оружия с фантастическими эффектами, реалистично надетых или разрываемых тканей, тумана и дыма с динамическим обтеканием объектов.
К реализации физических эффектов в играх уже давно стремятся многие девелоперы и разработчики игр. С каждым годом это направление становится все актуальнее. В современных играх взаимодействие объектов с окружающей средой осуществляется силами двух движков, набравших наибольшую популярность - Havok и PhysX.
Havok является старейшим движком, на котором пишется немало игр под PC и консоли. Еще в далеком 2006 году, тогда еще независимая ATI, демонстрировала ускорение физических эффектов силами видеокарт Radeon X1900XT. Однако позже Havok купила компания Intel, которая заявила, что физические эффекты будут рассчитываться данным движком силами процессоров.
PhysX был разработан компанией AGEIA, которая реализовывала "физику" акселераторами собственной разработки. Но так сложилось, что, не смотря на большую популярность этого движка среди разработчиков игр, реализация физических эффектов в играх силами специализированных ускорителей оказалась весьма спорной.
И вот в прошлом году компания NVIDIA купила AGEIA PhysX. Были сделано заявление, что посредством оптимизации драйверов движок PhysX будет адаптирован под использование видеокарт GeForce 8800GT и выше.
Ещё одно немаловажное новшество – новые режимы экономии энергии. Благодаря использованию прецизионного 65 нм техпроцесса и новых схемотехнических решений удалось добиться более гибкого и динамичного контроля энергопотребления. Так, потребление семейства графических чипов GeForce GTX 200 в ждущем режиме или в режиме 2D составляет около 25 Вт; при воспроизведении фильма Blu-ray DVD - около 35 Вт; при полной 3D нагрузке TDP не превышает 236 Вт. Графический чип GeForce GTX 200 может вовсе отключаться благодаря поддержке технологии HybridPower с материнскими платами на HybridPower-чипсетах nForce с интегрированной графикой (например, nForce 780a или 790i), при этом поток графики незначительной интенсивности попросту обсчитывается GPU, интегрированным в системную плату. Помимо этого, GPU семейства GeForce GTX 200 также обладают специальными модулями контроля энергопотребления, призванными отключать блоки графического процессора, не задействованные в данный момент.
Пользователь может конфигурировать систему на базе двух или трёх видеокарт семейства GeForce GTX 200 в режиме SLI при использовании материнских плат на базе соответствующих чипсетов nForce. В традиционном режиме Standard SLI (с двумя видеокартами) декларируется примерно 60-90% прирост производительности в играх; в режиме 3-way SLI – максимальное количество кадров в секунду при максимальных разрешениях экрана.
В рамках анонса новой серии графических процессоров семейства GeForce GTX 200 компания NVIDIA предлагает совершенно по-новому взглянуть на роль центрального и графического процессоров в современной сбалансированной настольной системе. Такой оптимизированный ПК, базирующийся на концепции гетерогенных вычислений (то есть, вычислений потока разнородных разнотипных задач), по мнению специалистов NVIDIA, обладает гораздо более сбалансированной архитектурой и значительно большим вычислительным потенциалом. Имеется в виду сочетание центрального процессора со сравнительно умеренной производительностью с наиболее мощной графикой или даже SLI-системой, что позволяет добиться пиковой производительности в наиболее тяжёлых играх, 3D и медиа приложениях.
прочем, интенсивные вычисления с помощью современных графических видеокарт давно не новость, но именно с появлением графических процессоров семейства GeForce GTX 200 компания NVIDIA ожидает значительного повышения интереса к технологии CUDA.
CUDA (Compute Unified Device Architecture) - вычислительная архитектура, нацеленная на решение сложных задач в потребительской, деловой и технической сферах - в любых приложениях, интенсивно оперирующих данными, с помощью графических процессоров NVIDIA. С точки зрения технологии CUDA новый графический чип GeForce GTX 280 это ни что иное как мощный многоядерный (сотни ядер!) процессор для параллельных вычислений.
Как было указано выше, графическое ядро семейства GeForce GTX 200 можно представить как чип, поддерживающий графический и вычислительный режимы. В одном из этих режимов – "вычислительном", тот же GeForce GTX 280 превращается в программируемый мультипроцессор с 240 ядрами и 1 Гб выделенной памяти – этакий выделенный суперкомпьютер с производительностью под терафлоп, что в разы повышает результативность работы с приложениями, хорошо распараллеливающими данные, например, кодирование видео, научные вычисления и пр.
Графические процессоры семейств GeForce 8 и 9 стали первыми на рынке, поддерживающими технологию CUDA, сейчас их продано более 70 млн. штук и интерес к проекту CUDA постоянно растёт. Подробнее узнать о проекте и скачать файлы, необходимые для начала работы можно здесь. В качестве примера на приведённых ниже скриншотах показаны примеры прироста производительности вычислений, полученные независимыми пользователями технологии CUDA.
По сравнению с предыдущим лидером GeForce 8800 GTX новый флагманский процессор GeForce GTX 280 обладает в 1,88 раза большим количеством процессорных ядер; способен обрабатывать примерно в 2,5 больше тредов на чип; обладает удвоенным размером файловых регистров и поддержкой вычислений с плавающей запятой с удвоенной точностью; поддерживает 1 Гб памяти с 512-битным интерфейсом; оборудован более эффективным диспетчером команд и улучшенными коммуникационными возможностями между элементами чипа; улучшенным модулем Z-буфера и компрессии, поддержкой 10-битной цветовой палитры и т.д.
Впервые новое поколение чипов GeForce GTX 200 изначально позиционируется не только в качестве мощного 3D графического акселератора, но также в качестве серьёзного компьютерного решения для параллельных вычислений.
Характеристики NVIDIA GeForce GTX 280
Наименование | GeForce GTX 280 |
Ядро | GT200 (D10U-30) |
Техпроцесс (мкм) | 0.065 |
Транзисторов (млн) | 1400 |
Частота работы ядра | 602 |
Частота работы памяти (DDR) | 1107 |
Шина и тип памяти | GDDR3 512-bit |
ПСП (Гб/с) | 141,67 |
Унифицированные шейдерные блоки | 240 |
Частота унифицированных шейдерных блоков | 1296 |
TMU на конвейер | 80 |
ROP | 32 |
Shaders Model | 4.0 |
Fill Rate (Mtex/s) | 48160 |
DirectX | 10 |
Интерфейс | PCIe 2.0 |
Революции не произошло, новый графический процессор GT200 и протестированная сегодня видеокарта GeForce 280GTX(285GTX , 295GTX) являются дальнейшим развитием унифицированной шейдерной архитектуры от компании NVIDIA. Новый графический процессор содержит большее количество функциональных блоков, чем у предшественников, что даёт ему право называться мощнейшим GPU на сегодняшний день.
Однако вначале о технических особенностях. Являясь логичным развитием серий GeForce 8 и GeForce 9, представлявших первое поколение унифицированной визуальной вычислительной архитектуры NVIDIA, новинки семейства GeForce GTX 200 выполнены на базе второго поколения этой архитектуры.
Графические процессоры NVIDIA GeForce GTX 280 и 260 представляют собой наиболее массивные и сложные графические чипы из известных доселе – шутка ли, 1,4 миллиарда транзисторов в каждом! Наиболее производительное решение - GeForce GTX 280, обладает 240 шейдерными процессорами, 80 текстурными процессорами, поддерживает до 1 Гб видеопамяти. Подробные характеристики чипов GeForce GTX 280 и GeForce GTX 260 приведены в таблице ниже.
Спецификации NVIDIA GeForce GTX 280 и GTX 260 |
||
Графическое ядро | ||
Нормы технологического процесса | ||
Количество транзисторов | ||
Тактовая частота графики (в т.ч. диспетчера, модулей текстур и ROP) | ||
Тактовые частоты процессорных модулей | ||
Количество процессорных модулей | ||
Тактовая частота памяти (частота/данные) | 1107 МГц / 2214 МГц |
999 МГц / 1998 МГц |
Ширина интерфейса памяти | ||
Пропускная способность шины памяти | ||
Объём памяти | ||
Количество модулей ROP | ||
Количество модулей текстурной фильтрации | ||
Производительность модулей текстурной фильтрации | 48,2 Гигатекселей/с |
36,9 Гигатекселей/с |
Поддержка HDCP | ||
Поддержка HDMI | Есть (адаптер DVI-HDMI) |
|
Интерфейсы | 2 x Dual-Link DVI-I |
|
RAMDAC, МГц | ||
Шина | ||
Форм-фактор | Два слота |
|
Конфигурация разъёмов питания | 1 x 8-контактный |
2 x 6-контактных |
Максимальное энергопотребление | ||
Граничная температура GPU |
Фактически современное графическое ядро семейства GeForce GTX 200 можно представить как универсальный чип, поддерживающий два разных режима – графический и вычислительный. Архитектуру чипов семейств GeForce 8 и 9 обычно представляют массивами масштабируемых процессоров (Scalable Processor Array, SPA). Архитектура чипов семейства GeForce GTX 200 основана на доработанной и улучшенной архитектуре SPA, состоящей из ряда так называемых "кластеров обработки текстур" (TPC, Texture Processing Clusters) в графическом режиме или "кластеров обработки потоков" в режиме параллельного вычисления. При этом каждый модуль TPC состоит из массива потоковых мультипроцессоров (SM, Streaming Multiprocessors), и каждый SM содержит восемь процессорных ядер, также называемых потоковыми процессорами (SP, Streaming Processor), или тредовыми процессорами (TP, Thread Processor). Каждый SM также включает в себя процессоры текстурной фильтрации для графического режима, также используемый для различных операций фильтрации в вычислительном режиме. Ниже представлена блок-схема GeForce 280 GTX в традиционном графическом режиме.
Переключаясь в вычислительный режим, аппаратный диспетчер потоков (вверху) управляет тредами TPC.
Кластер TPC при ближайшем рассмотрении: распределённая память для каждого SM; каждое процессорное ядро SM может распределять данные между другими ядрами SM посредством распределённой памяти, без необходимости обращения к внешней подсистеме памяти.
Таким образом, унифицированная шейдерная и компьютерная архитектура NVIDIA использует две совершенно разные вычислительные модели: для работы TPC используется MIMD (multiple instruction, multiple data), для вычислений SM - SIMT (single instruction, multiple thread), продвинутая версия, SIMD (single instruction, multiple data). Касаясь общих характеристик, по сравнению с предшествовавшими поколениями чипов семейство GeForce GTX 200 обладает следующими преимуществами:
Пользователь может конфигурировать систему на базе двух или трёх видеокарт семейства GeForce GTX 200 в режиме SLI при использовании материнских плат на базе соответствующих чипсетов nForce. В традиционном режиме Standard SLI (с двумя видеокартами) декларируется примерно 60-90% прирост производительности в играх; в режиме 3-way SLI – максимальное количество кадров в секунду при максимальных разрешениях экрана.
Следующая инновация – поддержка нового интерфейса DisplayPort с разрешениями выше 2560 х 1600, с 10-битным цветовым пространством (предыдущие поколения графики GeForce обладали внутренней поддержкой 10-битной обработки данных, но выводился только 8-битные компонентные цвета RGB). В рамках анонса новой серии графических процессоров семейства GeForce GTX 200 компания NVIDIA предлагает совершенно по-новому взглянуть на роль центрального и графического процессоров в современной сбалансированной настольной системе. Такой оптимизированный ПК , базирующийся на концепции гетерогенных вычислений (то есть, вычислений потока разнородных разнотипных задач), по мнению специалистов NVIDIA, обладает гораздо более сбалансированной архитектурой и значительно большим вычислительным потенциалом. Имеется в виду сочетание центрального процессора со сравнительно умеренной производительностью с наиболее мощной графикой или даже SLI-системой, что позволяет добиться пиковой производительности в наиболее тяжёлых играх, 3D и медиа приложениях. Иными словами, вкратце концепцию можно сформулировать так: центральный процессор в современной системе берёт на себя служебные функции, в то время как бремя тяжёлых вычислений ложится на графическую систему. Примерно те же выводы (правда, более комплексные и численно обоснованные) наблюдаются в серии наших статей, посвящённых исследованиям зависимости производительности от ключевых элементов системы, см. статьи Процессорозависимость видеосистемы. Часть I - Анализ ; Процессорозависимость видеосистемы. Часть II – Влияние объема кэш-памяти CPU и скорости оперативной памяти ; Ботозависимость, или зачем 3D-играм мощный CPU ; Процессорозависимость видеосистемы. Переходная область. "Критическая" точка частоты CPU . Впрочем, интенсивные вычисления с помощью современных графических видеокарт давно не новость, но именно с появлением графических процессоров семейства GeForce GTX 200 компания NVIDIA ожидает значительного повышения интереса к технологии CUDA. CUDA (Compute Unified Device Architecture) - вычислительная архитектура, нацеленная на решение сложных задач в потребительской, деловой и технической сферах - в любых приложениях, интенсивно оперирующих данными, с помощью графических процессоров NVIDIA. С точки зрения технологии CUDA новый графический чип GeForce GTX 280 это ни что иное как мощный многоядерный (сотни ядер!) процессор для параллельных вычислений. Как было указано выше, графическое ядро семейства GeForce GTX 200 можно представить как чип, поддерживающий графический и вычислительный режимы. В одном из этих режимов – "вычислительном", тот же GeForce GTX 280 превращается в программируемый мультипроцессор с 240 ядрами и 1 Гб выделенной памяти – этакий выделенный суперкомпьютер с производительностью под терафлоп, что в разы повышает результативность работы с приложениями, хорошо распараллеливающими данные, например, кодирование видео, научные вычисления и пр. Графические процессоры семейств GeForce 8 и 9 стали первыми на рынке, поддерживающими технологию CUDA, сейчас их продано более 70 млн. штук и интерес к проекту CUDA постоянно растёт. Подробнее узнать о проекте и скачать файлы, необходимые для начала работы можно . В качестве примера на приведённых ниже скриншотах показаны примеры прироста производительности вычислений, полученные независимыми пользователями технологии CUDA.
Подводя итог нашему краткому исследованию архитектурных и технологических улучшений, реализованных в новом поколении графических процессоров NVIDIA, выделим главные моменты. Второе поколение унифицированной архитектуры визуальных вычислений, реализованное в семействе GeForce GTX 200, является значительным шагом вперёд по сравнению с предшествовавшими поколениями GeForce 8 и 9.
По сравнению с предыдущим лидером GeForce 8800 GTX новый флагманский процессор GeForce GTX 280 обладает в 1,88 раза большим количеством процессорных ядер; способен обрабатывать примерно в 2,5 больше тредов на чип; обладает удвоенным размером файловых регистров и поддержкой вычислений с плавающей запятой с удвоенной точностью; поддерживает 1 Гб памяти с 512-битным интерфейсом; оборудован более эффективным диспетчером команд и улучшенными коммуникационными возможностями между элементами чипа; улучшенным модулем Z-буфера и компрессии, поддержкой 10-битной цветовой палитры и т.д. Впервые новое поколение чипов GeForce GTX 200 изначально позиционируется не только в качестве мощного 3D графического акселератора, но также в качестве серьёзного компьютерного решения для параллельных вычислений. Ожидается, что видеокарты GeForce GTX 280 с 1 Гб памяти появятся в рознице по цене порядка $649, новинки на базе GeForce GTX 260 с 896 Мб памяти – по цене около $449 (или даже $399). Проверить, насколько рекомендованные цены совпадают в реальной розницей, можно будет уже совсем скоро, поскольку по всем данным анонс семейства GeForce GTX 200 отнюдь не "бумажный", решения на этих чипах объявили многие партнёры NVIDIA, и в самом ближайшем времени новинки объявятся на прилавках. Теперь переходим к описанию первой видеокарты GeForce GTX 280, попавшей в нашу лабораторию, и к результатам её тестирования.
Так уж сложилось, что в последнее время на рынке 3D-ускорителей «балом правит» компания NVIDIA. Именно она выпускает самые быстрые современные видеокарты, порождая множество споров об их целесообразности, так как пользователям давно уже приходится мириться с тем, что "быстро" одновременно означает "очень горячо" и "очень дорого".
Объекты данного материала самые яркие представители этой категории. Мы познакомим вас с абсолютно новым High-End видеоадаптером GeForce GTX 280, и его предшественником в лице GeForce 9800 GX2. Обе эти карты сейчас самые дорогие на рынке, но при этом и самые быстрые. Старая карта демонстрирует такую мощь благодаря двум графическим чипам G92, а в основе новой - GPU последнего поколения GT200. Но обе отличаются огромными габаритами, "горячим нравом" и высоким энергопотреблением. Кто же быстрее и мощнее из этих двух монстров, мы и выясним ниже.
Особенности архитектуры GT200
После G80 NVIDIA не торопилась с кардинальными изменениями в архитектуре своих графических процессоров. Популярный G92 практически повторял предшественника, лишь ROP и текстурные блоки были немного улучшены. Новый же чип представляет собой следующее поколение универсальной шейдерной архитектуры, хотя, на самом деле, в основе его все так же лежит базовая архитектура G80.
Блоки TMU и ROP остались такими же, как и G92, но их количество было увеличено: до 80 текстурных блоков (по восемь на каждый TPC) и до 32 блоков растеризации, по восемь на каждый широкий ROP. Благодаря улучшениям текстурных блоков, NVIDIA говорит о 22% превосходстве в текстурировании относительно предшественника. Эффективность блоков ROP увеличена в возможности вывода до 32 пикселей с блендингом за такт, тогда как тот же G80 мог выводить только 24 пикселя и 12 с блендингом. Все вышесказанное касается старшего представителя на базе GT200 - GeForce GTX 280. Более доступное решение GeForce GTX 260 отличается чуть меньших числом функциональных блоков.
Но не только возможности по обработке графических задач были улучшены в новом чипе. Благодаря технологии CUDA, GT200 теперь может похвастаться поддержкой и других вычислительных задач. В таком режиме он работает как мультипроцессор с 240 вычислительными ядрами. Это позволит использовать эти видеокарты в специализированных расчетах. Справедливости ради, стоит отметить, что акселераторы Radeon уже давно обладают такой возможностью.
Большие вычислительные возможности чипа подтолкнули компанию на организацию расчетов физики в играх силами GPU. Эта технология является развитием технологии PhysX компании Ageia, которую недавно купила NVIDIA. Хотя тот факт, что энтузиастам удалось "взломать" драйверы NVIDIA и ввести поддержку аппаратного расчета физической модели в видеокарты Radeon, говорит о том, что PhysX не относится к каким-либо аппаратным особенностям графического чипа GT200, а является лишь соответствующей адаптацией программного API PhysX под универсальную щейдерную архитектуру.
Теперь, что касается еще одного нововведения. Шина памяти 512 бит (восемь 64-битных контроллеров памяти) при использовании GDDR3 позволила достичь пропускной способности в 141,67 Гб/с, и по этому критерию решение NVIDIA является лидером на рынке графических акселераторов. Но тут стоит отметить, что AMD пошла другим путем, и в своем новой графическом чипе RV770 ввела поддержку сверхбыстрой памяти GDDR5. Возможно, с выпуском новых GPU калифорнийцы также перейдут на использование прогрессивного типа памяти. Объем памяти у видеокарт GeForce GTX 280 составляет 1 ГБ, что для Hi-end решений становится уже нормой, учитывая аппетиты современных игровых приложений при выборе качественной графики. GeForce GTX 260 довольствуется лишь 896 мегабайтами памяти, при этом шина памяти составляет 448 бит.
GT200 выполняется по нормам 65-нм техпроцесса. В этом плане AMD пока лидирует - их новые чипы выполнены по 55-нм техпроцессу. Обладая огромных количеством транзисторов (1,4 млрд.) новый чип NVIDIA имеет громадную площадь в 576 кв. мм., а ширина кристалла достигает 2,4 см! С таким огромным ядром добиться выхода большого процента исправных чипов довольно тяжело, поэтому производство GT200 достаточно дорогое, что выливается в высокую окончательную стоимость готового продукта. Ниже приведено фото кристалла со схемой размещения его главных вычислительных блоков.
Также большой размер кристалла вынудил вынести блоки, отвечающие за интерфейсы (два RAMDAC, два Dual DVI, HDMI, DisplayPort, HDTV) в отдельный чип NVIO, что когда-то уже было с картами на базе G80. Из остальных интерфейсов отметим поддержку PCI Express 2.0 и двух разъемов для объединений видеокарт в режиме SLI и 3-way SLI.
Поддерживается технология HybridPower. При использовании материнской платы с данной технологией и встроенной видеокартой, внешняя в простое может быть отключена, а функции вывода изображения ложатся на плечи интегрированного графического ядра.
Никуда не делись возможности по аппаратному ускорению видео высокого разрешения, но и изменений нет. Все тот же PureVideo HD второго поколения, как и в предыдущих продуктах. Поддерживается вывод изображения через HDMI и DisplayPort.
А вот чего действительно не хватает в новом продукте, так это поддержки DirectX 10.1 и ShaderModel 4.1 - остался лишь "старый" DirectX 10.0. Конечно, программные преимущества обновленного API пока еще не используются разработчиками игр, но пора бы уже ввести поддержку соответствующих инструкций, тем более в новый топовый чип.
Подводя общие итоги по архитектуре, стоит отметить, что ничего кардинально со времен G92/G80 не поменялось, а все вычислительные блоки в среднем были увеличены в два раза. Остальные изменения коснулись лишь доработки функциональности этих самых блоков.
В таблицу, представленную ниже, занесены данные всех основных одночиповых решений различных поколений.
Видеокарта | GeForce GTX 280 | GeForce GTX 260 | GeForce 9800 GTX | GeForce 8800 GTS | GeForce 8800 GTX |
Ядро | GT200 | GT200 | G92 | G92 | G80 |
Число транзисторов, млн. | 1400 | 1400 | 754 | 754 | 681 |
Техпроцесс, нм | 65 | 65 | 65 | 65 | 90 |
Число процессоров | 240 | 192 | 128 | 128 | 128 |
Число TMU | 80 | 64 | 64 | 64 | 32 |
Число ROP | 32 | 28 | 16 | 16 | 24 |
Частота ядра, МГц | 602 | 576 | 675 | 650 | 575 |
Частота процессоров, МГц | 1296 | 1242 | 1688 | 1625 | 1350 |
Частота памяти, МГц | 2214 | 2000 | 2200 | 1940 | 1800 |
Шина памяти, бит | 512 | 448 | 256 | 256 | 384 |
Тип памяти | GDDR3 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
Объем памяти, МБ | 1024 | 896 | 512 | 512 | 768 |
Пропускная способность памяти, ГБ/с | 142 | 112 | 70,4 | 62 | 86,4 |
Интерфейс | PCI Express 2.0 | PCI Express 2.0 | PCI Express 2.0 | PCI Express 2.0 | PCI Express 1.1 |
Поддерживаемая версия DirectX | 10 | 10 | 10 | 10 | 10 |
Энергопотребление, Вт | 236 | 182 | 168 | 140 | 177 |
XpertVision GeForce GTX 280
Новый видеоадаптер от NVIDIA мы рассмотрим на примере продукта компании XpertVision, хотя на самом деле все карты, выпускаемые на данный момент, являются референсными, производимыми на "одном заводе". Делая свой выбор в пользу того или иного бренда, вы платите лишь за имя и комплектацию.
Мониторинг и разгон
Чип работает на частоте 602 МГц, при этом шейдерные блоки на 1296 МГц. Память GDDR3 функционирует на эффективных 2214 МГц (1107 МГц физических). Но такие частоты включаются лишь при загрузке GPU. В простое эти значения составляют лишь 300/100/200 МГц (ядро/шейдерный домен/память). При увеличении нагрузки ядро может быть установлено на частоту 400 МГц, память 594 МГц. А вот шейдерные блоки, судя по наблюдению, принимают лишь два дискретных значения.
RivaTuner 2.09 работает с новыми видеокартами, но скорость оборотов вентилятора не определяет. Эти данные можно просмотреть в утилите GPU-Z. Хотя управлять оборотами из меню RivaTuner можно, причем здесь положение ползунка соответствует активному на данный момент скоростному режиму в процентах.
Что касается разгона, то он оказался минимальный. Судя по артефактам, все упирается в охлаждение. Также нет возможности гнать отдельно растровый и шейдерный домены. Эта возможность в RivaTuner включается, но пока не работает. Частоты все равно изменяются синхронно, или даже могут сброситься до минимального порога. Видеокарту удалось разогнать до 633/1350/2520 МГц. По ядру это лишь на 5% выше номинала (что и разгоном то не назовешь), по памяти - 13% выше номинала. Учитывая изначально высокую ПСП этой видеокарты, можно предположить, что разгон памяти роли на итоговой производительности не играет.
Главным соперником новой видеокарты GeForce GTX 280 выступает мультичиповый GeForce 9800 GX2, основанный на двух ядрах G92-450. Эта видеокарта до выхода представителя нового поколения занимала место самого производительного продукта. Посмотрим, сможет ли ее победить новое одночиповое решение. Самое интересное, что суммарное количество вычислительных блоков GeForce 9800 GX2 одинаково с одночиповым GeForce GTX 280.
В отличие от компании AMD, которая видит будущее в таки мультиядерных решениях, NVIDIA продолжает концентрировать силы на разработке одночиповых карт. Выпуск GeForce 9800 GX2 был вынужденным ответом на Radeon HD3870 X2, так как новое поколение находилось в стадии разработки, а лавры лидера никто и никому не собирался отдавать. Учитывая, что одноядерная GeForce 8800GTS 512MB запросто превосходит Radeon HD 3870 по производительности, не мудрствуя лукаво, NVIDIA взяла да и объединила две платы в SLI в пределах одного корпуса. Изначально жизненный путь GeForce 9800 GX2 должен был быть очень коротким, но как мы увидим ниже, не стоит возлагать большие надежды на новое поколение и "старичок" еще очень даже успешно конкурирует с новым High-End-видеоадаптером.
В качестве представителя GeForce 9800 GX2 к нам на тестирование попала видеокарта от компании ZOTAC.
Комплектация:
Мониторинг и разгон
В соответствии со спецификацией данная видеокарта работает на частотах - 602/1512 МГц (ядро), 1998 МГц (физические 999 МГц) память. У данного видеоадаптера скорость оборотов турбины-кулера не определяется ни одной утилитой. Но в разделе управления кулером в RivaTuner скорость отображается в процентном соотношении и имеется возможность регулировать обороты турбины. Стартует вентилятор с немного более высоких оборотов чем у GeForce GTX 280, но зато и температура чипов немного меньше. В тесте ATITool температура ядер держалась на уровне 83-84°C.
По шумовым характеристикам система охлаждения соответствует таковой у GeForce GTX 280. То есть, так же сильно гудит, но зато со своей задачей справляется немного лучше.
Разгон у этой карты оказался не выдающийся, особенно, учитывая результаты разгона GeForce 8800GTS в нашем прошлом обзоре . Рассматриваемая же модель стабильно работала на частотах 702/1728/2130 МГц (ядро/стрим-процессоры/память). Более высокие значения приводили к зависанию системы в некоторых тестах. Обороты были подняты до максимума, но это не помогло улучшить разгон. Установленный на обдув 120-мм вентилятор тоже не изменил ситуацию, хотя еще на пару градусов температура снизилась. Зависания обычно являются признаком нехватки мощности, но используемого на тестовом стенде блока питания на 1 кВт должно было хватать с лихвой.
Видеокарта | XpertVision GeForce GTX 280 1GB | ZOTAC GeForce 9800GX2 512MB |
Кодовое имя процессора | GT200 | 2 x G92-450 |
Техпроцесс, нм | 65 | 65 |
Частота ядра, МГц | 602 | 602 |
Частота унифицированных шейдерных блоков, МГц | 1296 | 1512 |
Количество унифицированных шейдерных блоков | 240 | 2 x 128 |
Количество текстурных блоков TMU | 80 | 2 x 64 |
Блоков блендинга ROP | 32 | 2 x 16 |
Частота памяти, МГц | 2214 | 1998 |
Разрядность интерфейса памяти, бит | 512 | 2 x 256 |
Тестовый стенд:
Для сравнения с предыдущим поколением, в графики были добавлены результаты ASUS GeForce 8800 GTS 512MB из прошлого тестирования. Для этой карты использовались чуть более старые драйвера версии ForceWare 175.16.
Результаты тестирования в DirectX 9
S.T.A.L.K.E.R. (DX9)
Традиционно первым игровым тестом выступает этот популярный отечественный шутер .
TimeShift (DX9)
Unreal Tournament 3 (DX9)
Популярный сетевой шутер. На движке этой игры создано множество других популярных проектов, так что производительность в этом приложении очень показательна.
Call of Duty 4 (DX9)
Одна из лучших игр прошлого года.
Legend: Hand of God (DX9)
Diablo-клон с красивой графикой.
Race Driver: GRID (DX9)
Отличный автосимулятор с красивой графикой на движке Colin McRae Rally DIRT.
Для тестов использовался стандартный GPU-бенчмарк.
Devil May Cry4 (DX10)
Первый тест под DirectX 10. Игра хоть и новая, но отличается невысокими системными требованиями.
Crysis (DX10)
Тесты под DirectX 10 проводились в пропатченной версии 1.2. Проверим, подтверждается ли наше предположение, что основной потенциал GeForce GTX 280 раскрывается в DirectX 10.
Выводы
Если вы ждали сенсации и прорыва от новых видеоадаптеров NVIDIA, то можете ждать дальше. Прорыва подобного выходу G80, не случилось. Новый чип представляет собой в два раза увеличенный по мощности старый добрый чип G92 с небольшими улучшениями вычислительных блоков. На деле это выливается в то, что предыдущий флагман компании на двух G92 в большинстве игр обгоняет новичка. И это при том, что на GeForce 9800GX2 еще и цена меньше.
Конечно потенциал у новой видеокарты есть, шина 512 бит и большой объем памяти помогают ей иногда поддерживать лидерство в тяжелых режимах. Но проблема именно в этом "иногда". Добавьте к этому более высокое энергопотребление новой видеокарты и ее горячий нрав. Вывод напрашивается сам собой. Если есть более дешевая, часто более быстрая и немного более прохладная (все же температура ее чипов меньше) GeForce 9800 GX2, то зачем нам что-то другое и более дорогое?
Но есть и довольно веский аргумент в пользу новой модели. Многочиповые решения имеют определенные проблемы с программной оптимизацией. В нашем тестировании была лишь одна игра, где явно видно, что потенциал двух G92 не используется. В Legend: Hand of God GeForce 9800GX2 даже уступила пару процентов одночиповому предшественнику с более высокими чатсотами. В остальных же играх двухчиповый GeForce всегда обгонял GeForce 8800GTS, и иногда довольно существенно. Так что не так страшен SLI, как его рисуют. По крайней мере, так обстоят дела на 32-разрядных операционных системах. На x64, по отзывам, дела с оптимизацией обстоят похуже. Последние борцы за одночиповые решения могут вспомнить и характерные "лаги" у двухчиповых карт. Да, такое имеет место быть. Но из всех протестированных игр это явно было заметно лишь в Crysis. В остальных играх игровой процесс если не идеален, то кратковременные просадки производительности не заметны. Видеокарта мощная, и если даже будет просадка от 100 до 50 FPS, то 90% игроков этого просто не почувствуют.
На фоне таких приятных умозаключений напрашивается еще один вопрос. А зачем нам тогда и GeForce 9800GX2 нужен? Если за ее цену можно спокойно взять две GeForce 8800 GTS и поставить их в SLI. При этом карты будут лучше охлаждаться, что позволит даже больше их разогнать. Ведь GeForce 9800 GX2 практически ничем не отличается от того же SLI, который можно получить на материнской плате.
Если же сравнивать цены на рассмотренные сегодня продукты с их уровнем производительности, то становится ясно, что 50-100% прироста производительности над одной 8800GTS выливаются в 2-3 кратное увеличение цены. При этом вы получаете печку с невыносимым уровнем шума. Платить 500-700 у.е. за топовый акселератор, чтобы играть затыкая уши? Бред. Так что, сразу же приготовьтесь менять стандартную систему охлаждения, и желательно на СВО.
Положа руку на сердце, стоит сказать, что продукты подобные GeForce 9800 GX2 и GeForce GTX 280 в соотношении "цена/производительность" не самые привлекательные варианты. Но High-End всегда таким был. Мы переплачиваем за возможность купить уже сейчас, то, что через год будет стоить в два раза дешевле. Но все же хотелось бы за такие деньги получить готовый к "употреблению" продукт, а не конструктор для энтузиастов. Если вы не считаетесь с финансами и всегда мечтали собрать себе SLI из двух или трех мощнейших видеокарт, при этом в придачу организовать СВО, то рассмотренные модели как раз то, что надо. Мощнее и горячее их пока нет. :)
В одном из ближайших материалов мы постараемся познакомить вас с новыми мощными видеоадаптерами от AMD и NVIDIA меньшей ценовой категории. Сравним их с данными топовыми моделями и выясним, какая модель все же самая эффективная в соотношении "цена/производительность".
Благодарим следующие компании за предоставленное тестовое оборудование: