Tapasztalja meg a nagyfelbontású világokat, az élethű karaktereket és a természet olyan erős erőit, hogy izzad a tenyere, és minden képkockán a szíve dobog. A játékokon túl Blu-ray filmeket is nézhet, és akár 7-szeresre kódolhat videókat gyorsabb, mint hagyományos CPU-k 1 .
GEFORCE GTX 200 GPU-k | JÁTÉK TÚL | A JÁTÉKON TÚL | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bemutatkozik NVIDIA GeForce GTX 280 és GeForce GTX 260 Az NVIDIA megbeszélést folytat a fejlesztőkkel a GeForce GTX 200 játékaik teljesítményéről |
Az NVIDIA GeForce GTX 200 GPU-k a korábban látott szinteken felülmúlják a játékot és az effektusokat Medusa demó az NVIDIA és az NVIDIA® PhysX™ Technology, valamint a NaturalMotion által. |
Több, mint játék – az NVIDIA GeForce GTX 200 GPU-k felgyorsítják a legújabb fogyasztói alkalmazásokat
1 A GeForce GTX 280 GPU az NVIDIA PhysX technológia hardveres támogatásával érkezik. Az NVIDIA PhysX illesztőprogramok szükségesek a játékon belüli PhysX GPU gyorsításhoz. További információkért tekintse meg a címet. Megjegyzés: Az alábbi specifikációk ezt a GPU-t az NVIDIA referencia grafikus kártya tervezésébe beépítve mutatják be. A grafikus kártya specifikációi a bővítőkártya gyártójától függően változhatnak. Kérjük, tekintse meg a Bővítménykártya gyártóinak webhelyét a tényleges szállítási specifikációkért. GPU motor specifikációi:
Memória specifikációk:
Funkció támogatás:
Kijelző támogatás:
Szabványos grafikus kártya méretei:
Hő- és teljesítményjellemzők:
A processzormagok száma modellenként változhat. |
Az eddigi legproduktívabb egychipes megoldás a GeForce GTX 280 volt – 240 shader processzorral, 80 textúraprocesszorral rendelkezik, akár 1 GB videomemóriát is támogat. Valójában a GeForce GTX 200 család modern grafikus magja egy univerzális chipként képzelhető el, amely két különböző módok- grafika és számítástechnika. A GeForce 8 és 9 család chiparchitektúráját általában skálázható processzorok tömbjei (Scalable Processor Array, SPA) képviselik. A GeForce GTX 200 lapkacsalád architektúrája egy átdolgozott és továbbfejlesztett SPA architektúrán alapul, amely számos úgynevezett "textúrafeldolgozó fürtből" (TPC, textúrafeldolgozó fürtből) áll grafikus módban, vagy "stream feldolgozó fürtökből" (Stream Processing Cluster) párhuzamos számítási mód.
Ezen túlmenően, minden TPC-modul egy sor streaming többprocesszorból áll (SM, Streaming Multiprocessors), és mindegyik SM nyolc processzormagot tartalmaz, amelyeket stream processzoroknak (SP, Streaming Processor) vagy szálprocesszoroknak (TP, Thread Processor) is neveznek. Mindegyik SM tartalmaz textúraszűrő processzorokat grafikus módhoz, amelyeket számítási módban is használnak különféle szűrési műveletekhez.
Az alábbiakban a GeForce 280 GTX blokkvázlata látható hagyományos grafikus módban.
Számítási módra váltva a hardveres szálkezelő (fent) kezeli a TPC szálakat.
Közelebbről a TPC-fürtre: megosztott memória SM-enként; minden SM processzormag meg tud osztani adatokat a többi SM mag között elosztott memórián keresztül anélkül, hogy külső memória alrendszerhez kellene hozzáférni.
Így az NVIDIA egységes árnyékolója és számítógép-architektúrája két teljesen különböző számítási modellt használ: a TPC működéshez a MIMD (több utasítás, több adat), az SM számításokhoz - SIMT (egy utasítás, többszálas), fejlett verzió, SIMD (egy utasítás) használható. , több adat).
megható Általános jellemzők, a korábbi generációs chipekhez képest a GeForce GTX 200 család a következő előnyökkel rendelkezik:
Képes időegységenként háromszor több adatfolyam feldolgozására
Új dizájn parancsütemező, 20%-kal nagyobb textúrafeldolgozási hatékonysággal
512 bites memória interfész (384 bit az előző generációhoz)
Optimalizált z-mintavételi és tömörítési folyamat a jobb teljesítmény érdekében nagy képernyőfelbontás mellett
Építészeti fejlesztések az árnyékfeldolgozási teljesítmény javítása érdekében
Teljes sebességű keretpuffer keverés (a 8800 GTX félsebességgel szemben)
Megduplázott utasításpuffer a jobb számítási teljesítmény érdekében
Megduplázódott a regiszterek száma a hosszú és összetett shaderek gyorsabb kiszámításához
Dupla pontosságú lebegőpontos kompatibilis az IEEE 754R verzióval
Hardveres támogatás a 10 bites színtérhez (csak DisplayPort)
Íme egy lista az új chipek főbb jellemzőiről:
NVIDIA PhysX támogatás
A Microsoft DirectX 10, Shader Model 4.0 támogatása
NVIDIA CUDA technológia támogatása
PCI Express 2.0 busz támogatás
A GigaThread technológia támogatása
NVIDIA Lumenex motor
128 bites lebegőpontos (HDR)
OpenGL 2.1 támogatás
Dual Dual-link DVI támogatás
Az NVIDIA PureVideo HD technológia támogatása
NVIDIA HybridPower technológia támogatása
Külön meg kell jegyezni, hogy a DirectX 10.1-et a GeForce GTX 200 család nem támogatja. Ennek az az oka, hogy egy új család chipjeinek fejlesztésekor a partnerekkel való egyeztetést követően szokás volt, hogy nem a továbbra is kevéssé igényes DirectX 10.1 támogatására, hanem a chipek architektúrájának és teljesítményének javítására helyezték a hangsúlyt.
A fizikai algoritmusok csomagján alapuló NVIDIA PhysX technológia megvalósítása egy erőteljes, valós idejű fizikai motor. Jelenleg a PhysX támogatás több mint 150 játékban van megvalósítva. Az erős GPU-val kombinálva a PhysX motor jelentősen növeli a fizikai feldolgozási teljesítményt, különösen olyan területeken, mint a por- és törmelékrobbanások, összetett arckifejezésű karakterek, fantasztikus hatású új fegyverek, valósághűen kopott vagy szakadt anyagok, köd és füst dinamikus áramlással az objektumok körül.
Sok fejlesztő és játékfejlesztő már régóta törekszik fizikai effektusok implementálására a játékokban. Ez az irány évről évre egyre aktuálisabbá válik. BAN BEN modern játékok az objektumok és a környezet közötti kölcsönhatást két legnagyobb népszerűségre szert tett motor - a Havok és a PhysX - erői hajtják végre.
A Havok a legrégebbi motor, amelyre számos játék íródott PC-re és konzolokra. Az akkor még független ATI még 2006-ban demonstrálta a fizikai hatások felgyorsítását a Radeon X1900XT videokártyák erejével. A Havokot azonban később az Intel megvásárolta, és kijelentette, hogy a fizikai hatásokat ez a motor fogja kiszámítani processzorok segítségével.
A PhysX-et az AGEIA fejlesztette ki, amely saját tervezésű gyorsítókkal valósította meg a "fizikát". De úgy történt, hogy ennek a motornak a játékfejlesztők körében nagy népszerűsége ellenére a fizikai effektusok speciális gyorsítókkal történő megvalósítása a játékokban nagyon ellentmondásosnak bizonyult.
Tavaly pedig az NVIDIA megvásárolta az AGEIA PhysX-et. Elhangzott egy nyilatkozat, hogy a meghajtó optimalizálás révén a PhysX motort a GeForce 8800GT és magasabb videokártyák használatához igazítják.
Egy másik fontos újítás az új energiatakarékos módok. A precíziós 65 nm-es folyamattechnológia és az új áramköri megoldások segítségével rugalmasabb és dinamikusabb teljesítményszabályozást sikerült elérni. Így a GeForce GTX 200 család grafikus lapkáinak fogyasztása készenléti vagy 2D módban körülbelül 25 W; Blu-ray DVD-film lejátszásakor - körülbelül 35 W; teljes 3D terhelésnél a TDP nem haladja meg a 236 wattot. A GeForce GTX 200 grafikus chip teljesen letiltható a HybridPower technológia támogatása miatt integrált grafikával rendelkező nForce HybridPower lapkakészleteken alapuló alaplapoknál (például nForce 780a vagy 790i), míg az alacsony intenzitású grafikus adatfolyamot egyszerűen a GPU számítja ki. beépítve alaplap. Ezenkívül a GeForce GTX 200 család GPU-i speciális energiagazdálkodási modulokkal is rendelkeznek, amelyek célja a GPU-blokkok letiltása, amelyek nem vesznek részt Ebben a pillanatban.
A felhasználó a GeForce GTX 200 család két vagy három videokártyáján alapuló rendszert konfigurálhat SLI módban, ha a megfelelő nForce lapkakészleteken alapuló alaplapokat használ. A hagyományos Standard SLI módban (két videokártyával) körülbelül 60-90%-os teljesítménynövekedést jeleznek a játékokban; 3-utas SLI módban - a maximális képkocka száma másodpercenként maximális képernyőfelbontás mellett.
Az új GeForce GTX 200 GPU-család bejelentésének részeként az NVIDIA teljesen új pillantást vet a CPU és a GPU szerepére a modern kiegyensúlyozott asztali rendszerben. Az NVIDIA szakértői szerint egy ilyen optimalizált PC, amely a heterogén számítástechnika (vagyis heterogén heterogén feladatok folyamának kiszámítása) koncepcióján alapul, sokkal kiegyensúlyozottabb architektúrával és lényegesen nagyobb számítási potenciállal rendelkezik. Ez a viszonylag mérsékelt teljesítményű CPU és a legerősebb grafikus vagy akár SLI rendszer kombinációjára utal, amely csúcsteljesítményt tesz lehetővé a legigényesebb játékokban, 3D-s és médiaalkalmazásokban.
Ezzel szemben a modern grafikus kártyák segítségével történő intenzív számítástechnika már régóta nem újdonság, de a GeForce GTX 200 grafikus processzorcsalád megjelenésével az NVIDIA a CUDA technológia iránti érdeklődés jelentős növekedésére számít.
A CUDA (Compute Unified Device Architecture) egy olyan számítástechnikai architektúra, amely összetett problémák megoldását célozza meg a fogyasztói, üzleti és műszaki területeken – bármilyen adatigényes, grafikus alkalmazást használó alkalmazásban. NVIDIA processzorok. A CUDA technológia szempontjából az új GeForce GTX 280 grafikus chip nem más, mint egy erőteljes többmagos (több száz magos!) Processzor a párhuzamos számításokhoz.
Mint fentebb említettük, a GeForce GTX 200 család grafikus magja egy olyan chipnek tekinthető, amely támogatja a grafikus és számítási módokat. Az egyik ilyen módban - a "számítás" -ban ugyanaz a GeForce GTX 280 programozható többprocesszorsá alakul 240 maggal és 1 GB dedikált memóriával - egyfajta dedikált szuperszámítógéppé, teraflop teljesítménnyel, amely jelentősen megnöveli az adatokat jól párhuzamosító alkalmazások teljesítményét. , például videokódolás, tudományos számítástechnika stb.
A GeForce 8 és 9 grafikus processzorcsaládok elsőként támogatták a piacon a CUDA technológiát, több mint 70 millió darabot adtak el, és a CUDA projekt iránti érdeklődés folyamatosan nő. Tudjon meg többet a projektről, és töltse le a kezdéshez szükséges fájlokat itt. Példaként az alábbi képernyőképek a CUDA technológia független felhasználói által elért számítási teljesítménynövekedés példáit mutatják be.
A korábbi vezető GeForce 8800 GTX-hez képest az új zászlóshajó GeForce GTX 280 1,88-szor annyi processzormagot tartalmaz; még körülbelül 2,5 szál feldolgozására képes chipenként; kétszer akkora fájlregiszterekkel rendelkezik, és támogatja a dupla pontosságú lebegőpontos számításokat; támogatja az 1 GB memóriát 512 bites interfésszel; hatékonyabb parancskezelővel felszerelt és továbbfejlesztett kommunikációs képességek a chip elemei között; továbbfejlesztett Z-puffer és tömörítő modul, 10 bites támogatás szín paletta stb.
A GeForce GTX 200 chipek új generációját először nem csak erőteljes 3D-s grafikus gyorsítóként, hanem komoly számítógépes megoldásként is pozícionálják a párhuzamos számításokhoz.
Műszaki adatok NVIDIA GeForce GTX 280
Név | GeForce GTX 280 |
Mag | GT200 (D10U-30) |
Feldolgozási technológia (µm) | 0.065 |
Tranzisztorok (millió) | 1400 |
Magfrekvencia | 602 |
Memória frekvencia (DDR) | 1107 |
Busz és memória típusa | GDDR3 512 bites |
Sávszélesség (Gb/s) | 141,67 |
Egységes árnyékoló blokkok | 240 |
Unified shader egységek gyakorisága | 1296 |
TMU szállítószalagonként | 80 |
ROP | 32 |
Shader modell | 4.0 |
Kitöltési arány (Mtex/s) | 48160 |
DirectX | 10 |
Felület | PCIe 2.0 |
A forradalom nem történt meg, az új GPU GT200 és a ma tesztelt GeForce 280GTX (285GTX , 295GTX) videokártya az NVIDIA egységes shader architektúrájának továbbfejlesztése. Az új GPU több funkcionális blokkot tartalmaz, mint elődei, ami jogot ad arra, hogy az eddigi legerősebb GPU-nak nevezzék.
Az elején azonban műszaki jellemzők. Az NVIDIA egységes vizuális számítástechnikai architektúrájának első generációját képviselő GeForce 8 és GeForce 9 sorozat logikus továbbfejlesztéseként az új GeForce GTX 200 család ennek az architektúrának a második generációján alapul.
Az NVIDIA GeForce GTX 280 és 260 GPU-k az eddig ismert legmasszívabb és legösszetettebb grafikus chipek – nem vicc, mindegyik 1,4 milliárd tranzisztorból áll! A legproduktívabb megoldás - GeForce GTX 280, 240 shader processzorral, 80 textúra processzorral rendelkezik, akár 1 GB videomemóriát is támogat. Részletes specifikációk A GeForce GTX 280 és GeForce GTX 260 lapkák az alábbi táblázatban láthatók.
Az NVIDIA GeForce GTX 280 és GTX 260 specifikációi |
||
Grafikus mag | ||
Folyamat szabványok | ||
A tranzisztorok száma | ||
Grafikus órajel (beleértve a diszpécsert, a textúra modulokat és a ROP-t) | ||
A processzormodulok órajel-frekvenciái | ||
Processzor modulok száma | ||
Memória óra (frekvencia/adat) | 1107 MHz / 2214 MHz |
999 MHz / 1998 MHz |
Memória interfész szélessége | ||
Memóriabusz sávszélessége | ||
memória | ||
ROP-ok száma | ||
Textúraszűrő modulok száma | ||
Textúra szűrési teljesítmény | 48,2 Gigatexel/s |
36,9 Gtexel/s |
HDCP támogatás | ||
HDMI támogatás | Igen (DVI-HDMI adapter) |
|
Interfészek | 2 db Dual-Link DVI-I |
|
RAMDAC, MHz | ||
Gumi | ||
Formafaktor | Két nyílás |
|
Tápcsatlakozó konfigurációja | 1x8 tűs |
2x 6 tűs |
Maximális energiafogyasztás | ||
GPU vágási hőmérséklet |
Valójában a GeForce GTX 200 család modern grafikus magja egy univerzális chipként képzelhető el, amely két különböző módot támogat - a grafikát és a számítástechnikát. A GeForce 8 és 9 család chiparchitektúráját általában skálázható processzorok tömbjei (Scalable Processor Array, SPA) képviselik. A GeForce GTX 200 lapkacsalád architektúrája egy átdolgozott és továbbfejlesztett SPA architektúrán alapul, amely számos úgynevezett "textúrafeldolgozó fürtből" (TPC, textúrafeldolgozó fürtből) áll grafikus módban, vagy "stream feldolgozó fürtökből" (Stream Processing Cluster) párhuzamos számítási mód. Ezen túlmenően, minden TPC-modul egy sor streaming többprocesszorból áll (SM, Streaming Multiprocessors), és mindegyik SM nyolc processzormagot tartalmaz, amelyeket stream processzoroknak (SP, Streaming Processor) vagy szálprocesszoroknak (TP, Thread Processor) is neveznek. Mindegyik SM tartalmaz textúraszűrő processzorokat grafikus módhoz, amelyeket számítási módban is használnak különféle szűrési műveletekhez. Az alábbiakban a GeForce 280 GTX blokkvázlata látható hagyományos grafikus módban.
Számítási módra váltva a hardveres szálkezelő (fent) kezeli a TPC szálakat.
Közelebbről a TPC-fürtre: megosztott memória SM-enként; minden SM processzormag meg tud osztani adatokat a többi SM mag között elosztott memórián keresztül anélkül, hogy külső memória alrendszerhez kellene hozzáférni.
Így az NVIDIA egységes árnyékolója és számítógép-architektúrája két teljesen különböző számítási modellt használ: a TPC működéshez a MIMD (több utasítás, több adat), az SM számításokhoz - SIMT (egy utasítás, többszálas), fejlett verzió, SIMD (egy utasítás) használható. , több adat). Ami az általános jellemzőket illeti, az előző generációs chipekhez képest a GeForce GTX 200 család a következő előnyökkel rendelkezik:
A felhasználó a GeForce GTX 200 család két vagy három videokártyáján alapuló rendszert konfigurálhat SLI módban, ha a megfelelő nForce lapkakészleteken alapuló alaplapokat használ. A hagyományos Standard SLI módban (két videokártyával) a játékokban körülbelül 60-90%-os teljesítménynövekedés deklarálható; 3-utas SLI módban - a maximális képkocka száma másodpercenként maximális képernyőfelbontás mellett.
A következő újítás az új támogatása DisplayPort interfész 2560 x 1600 feletti felbontás, 10 bites színtérrel (a GeForce grafikus kártyák korábbi generációi natívan támogatták a 10 bites feldolgozást, de csak 8 bites RGB komponens színeket adtak ki). Az új GeForce GTX 200 GPU-család bejelentésének részeként az NVIDIA teljesen új pillantást vet a CPU és a GPU szerepére a modern kiegyensúlyozott asztali rendszerben. Ilyen optimalizált PC, a koncepció alapján heterogén számítástechnika(vagyis különféle típusú heterogén feladatok folyamának kiszámítása), az NVIDIA szakértői szerint sokkal kiegyensúlyozottabb architektúrával és lényegesen nagyobb számítási potenciállal rendelkezik. Ez a viszonylag mérsékelt teljesítményű CPU és a legerősebb grafikus vagy akár SLI rendszer kombinációjára utal, amely csúcsteljesítményt tesz lehetővé a legigényesebb játékokban, 3D-s és médiaalkalmazásokban. Más szavakkal, a koncepció a következőképpen foglalható össze: CPU V modern rendszerátveszi a háztartási funkciókat, miközben a nehéz számítások terhe a grafikus rendszerre hárul. Körülbelül ugyanezek a következtetések (bár bonyolultabbak és számszerűsítettek) a teljesítménynek a rendszer kulcselemeitől való függésének vizsgálatával foglalkozó cikkeinkben is megtalálhatók, lásd a Videórendszer processzorfüggősége című cikkeket. I. rész – Elemzés; A videórendszer processzorfüggősége. II. rész – A CPU gyorsítótár méretének és a RAM sebességének hatása; Bot-függőség, avagy miért kell a 3D-s játékokhoz erős CPU? A videórendszer processzorfüggősége. átmeneti terület. A CPU frekvenciájának "kritikus" pontja. A modern grafikus kártyák segítségével végzett intenzív számítástechnika azonban már régóta nem újdonság, de éppen a GeForce GTX 200 grafikus processzorcsalád megjelenésével számít az NVIDIA a CUDA technológia iránti érdeklődés jelentős növekedésére. A CUDA (Compute Unified Device Architecture) egy olyan számítási architektúra, amely összetett problémák megoldását célozza a fogyasztói, üzleti és műszaki területeken – minden adatigényes alkalmazásban, NVIDIA GPU-kat használva. A CUDA technológia szempontjából az új GeForce GTX 280 grafikus chip nem más, mint egy erőteljes többmagos (több száz magos!) Processzor a párhuzamos számításokhoz. Mint fentebb említettük, a GeForce GTX 200 család grafikus magja egy olyan chipnek tekinthető, amely támogatja a grafikus és számítási módokat. Ezen módok egyikében – a „számítástechnikában” – ugyanaz a GeForce GTX 280 programozható többprocesszorsá alakul 240 maggal és 1 GB dedikált memóriával – egyfajta dedikált szuperszámítógéppé teraflop teljesítménnyel, amely jelentősen megnöveli az adatokat jól párhuzamosító alkalmazások teljesítményét. például videókódolás, tudományos számítástechnika stb. A GeForce 8 és 9 család grafikus processzorai voltak az elsők a piacon, amelyek támogatták a CUDA technológiát, mára több mint 70 millió darabot adtak el, és a CUDA projekt iránti érdeklődés folyamatosan nő. . Többet megtudhat a projektről, és letöltheti a kezdéshez szükséges fájlokat. Példaként az alábbi képernyőképek a CUDA technológia független felhasználói által elért számítási teljesítménynövekedés példáit mutatják be.
Az NVIDIA GPU-k új generációjában végrehajtott építészeti és technológiai fejlesztések rövid feltárásának összefoglalásaként emeljük ki a főbb pontokat. A GeForce GTX 200 családban megvalósított egységes vizuális számítási architektúra második generációja jelentős előrelépést jelent a GeForce 8 és 9 korábbi generációihoz képest.
A korábbi vezető GeForce 8800 GTX-hez képest az új zászlóshajó GeForce GTX 280 1,88-szor annyi processzormagot tartalmaz; még körülbelül 2,5 szál feldolgozására képes chipenként; kétszer akkora fájlregiszterekkel rendelkezik, és támogatja a dupla pontosságú lebegőpontos számításokat; támogatja az 1 GB memóriát 512 bites interfésszel; hatékonyabb parancsnoki diszpécserrel és továbbfejlesztett kommunikációs képességekkel a chip elemek között; továbbfejlesztett Z-puffer és tömörítő modul, 10 bites színpaletta támogatása stb. A GeForce GTX 200 chipek új generációját először nem csak erőteljes 3D-s grafikus gyorsítóként, hanem komoly számítógépes megoldásként is pozícionálják a párhuzamos számításokhoz. Az 1 GB memóriával szerelt GeForce GTX 280 videokártyák várhatóan körülbelül 649 dolláros áron jelennek meg a kiskereskedelmi forgalomban, az új, GeForce GTX 260 alapú, 896 MB memóriával rendelkező kártyák pedig körülbelül 449 dollárba (vagy akár 399 dollárba) kerülnek majd. A valós kiskereskedelemben le lehet majd ellenőrizni, hogy az ajánlott árak mennyire egyeznek, erre nagyon hamar lehetőség lesz, ugyanis minden adat szerint a GeForce GTX 200 család bejelentése korántsem "papír", ezekre épülő megoldások chipeket számos NVIDIA partner bejelentette, és a közeljövőben új termékek is megjelennek a polcokon. Most pedig térjünk át a laboratóriumunkba elsőként került GeForce GTX 280 videokártya leírására, illetve a tesztelés eredményeire.
Történt ugyanis, hogy az utóbbi időben a 3D-s gyorsítók piacát az NVIDIA uralja. Ő gyártja a leggyorsabb modern videokártyákat, sok vitát generálva azok célszerűségével kapcsolatban, mivel a felhasználóknak régóta bele kell tűrniük, hogy a "gyors" egyszerre jelent "nagyon meleget" és "nagyon drága".
Ennek az anyagnak a tárgyai ennek a kategóriának a legfényesebb képviselői. Bemutatjuk Önnek a vadonatúj csúcskategóriás GeForce GTX 280 videoadaptert és annak elődjét, a GeForce 9800 GX2-t. Mindkét kártya jelenleg a legdrágább a piacon, de egyben a leggyorsabb is. régi térkép két G92 grafikus chipnek köszönhetően ezt az erőt demonstrálja, és az új középpontjában a legújabb generációs GT200 GPU áll. De mindkettőt hatalmas méretük, "forró kedélyük" és magas energiafogyasztásuk jellemzi. Az alábbiakban megtudjuk, hogy ki a gyorsabb és erősebb a két szörny közül.
GT200 architektúra jellemzői
A G80 után az NVIDIA nem sietett a GPU-i architektúrájának radikális változtatásaival. A népszerű G92 gyakorlatilag megismételte elődjét, csak a ROP és a textúra egységek javítottak némileg. Az új chip az univerzális shader architektúra következő generációja, bár valójában még mindig az alap G80 architektúrán alapul.
A TMU-k és ROP-ok ugyanazok, mint a G92-nél, de számuk 80 textúraegységre (TPC-nként nyolc) és 32 ROP-ra nőtt, széles ROP-nként nyolcra. A textúraegység-fejlesztéseknek köszönhetően az NVIDIA 22%-os textúrabeli javulást ígér elődjéhez képest. A ROP blokkok hatékonysága megnövekedett abban, hogy akár 32 képpontot is kiadnak keveréssel órajelenként, míg ugyanaz a G80 csak 24 képpontot, keveréssel pedig 12 pixelt tudott kiadni. A fentiek mindegyike a GT200 - GeForce GTX 280 alapú vezető képviselőre vonatkozik. A kedvezőbb árú GeForce GTX 260 megoldásban valamivel kevesebb funkcionális blokk található.
De nem csak a feldolgozási képességek grafikai feladatok javítottak az új chipben. A CUDA technológiának köszönhetően a GT200 mostantól más számítástechnikai feladatokat is támogat. Ebben az üzemmódban többprocesszorként működik 240 processzormaggal. Ez lehetővé teszi ezeknek a videokártyáknak a speciális számításokban történő használatát. Az igazság kedvéért érdemes megjegyezni, hogy a Radeon gyorsítók már régóta rendelkeznek ezzel a képességgel.
A chip nagy számítási képességei arra késztették a céget, hogy a GPU-t használó játékokban megszervezze a fizika számításait. Ez a technológia az Ageia PhysX technológiájának továbbfejlesztése, amelyet az NVIDIA nemrég vásárolt meg. Bár az a tény, hogy a rajongóknak sikerült "hackelni" NVIDIA illesztőprogramokés bevezeti a hardveres számítási támogatást fizikai modell V Radeon videokártyák, azt jelzi, hogy a PhysX nem utal a GT200 grafikus chip egyetlen hardverfunkciójára sem, hanem csak a PhysX szoftver API megfelelő adaptációja az univerzális shader architektúrához.
Most egy újabb innováció. Egy 512 bites memóriabusz (nyolc 64 bites memóriavezérlő) GDDR3-mal elérhető sávszélesség 141,67 Gb / s sebességgel, és e kritérium szerint az NVIDIA megoldás piacvezető grafikus gyorsítók. De itt érdemes megjegyezni, hogy az AMD más utat járt be, és az új RV770 grafikus chipben bevezette az ultragyors GDDR5 memória támogatását. Talán az új GPU-k megjelenésével a kaliforniaiak is áttérnek a progresszív típusú memória használatára. A GeForce GTX 280 videokártyák memóriája 1 GB, ami már a Hi-end megoldások normájává válik, tekintve a modern játékalkalmazások étvágyát a jó minőségű grafika kiválasztásánál. A GeForce GTX 260 mindössze 896 megabájt memóriával rendelkezik, míg a memóriabusz 448 bites.
A GT200 65 nm-es folyamattechnológiával készült. Ebben a tekintetben továbbra is az AMD áll az élen – új chipjeik 55 nm-es technológiai technológiával készülnek. A hatalmas számú tranzisztorral (1,4 milliárd) az új NVIDIA chip hatalmas, 576 négyzetméteres területtel rendelkezik. mm., és a kristály szélessége eléri a 2,4 cm-t! Ilyen hatalmas maggal meglehetősen nehéz jó chipek magas százalékát elérni, ezért a GT200 gyártása meglehetősen drága, ami a késztermék magas végső költségét jelenti. Az alábbiakban egy fotó a kristályról a fő számítási egységek elrendezésével.
Szintén a kocka nagy mérete miatt kellett az interfészekért felelős blokkokat (két RAMDAC, két Dual DVI, HDMI, DisplayPort, HDTV) külön NVIO chipbe eltávolítani, ami egykor a G80 alapú kártyáknál volt. A többi interfész közül kiemeljük a PCI Express 2.0 támogatását, valamint két slotot a videokártyák SLI és 3-utas SLI módban való kombinálására.
Támogatja a HybridPower technológiát. Az ilyen technológiájú alaplap és integrált grafikus kártya használata esetén a külső grafikus kártya alapjáraton letiltható, a képkimeneti funkciók pedig az integrált grafikus mag vállára esnek.
A nagyfelbontású videó hardveres gyorsításának lehetőségei nem szűntek meg, de nincs változás sem. Ugyanaz a második generációs PureVideo HD, mint a korábbi termékekben. A képkimenet a HDMI-n és a DisplayPorton keresztül támogatott.
Az új termékből azonban nagyon hiányzik a DirectX 10.1 és a ShaderModel 4.1 támogatása – már csak a "régi" DirectX 10.0 maradt. Természetesen a frissített API szoftveres előnyeit még nem használják ki a játékfejlesztők, de ideje lenne bevezetni a megfelelő utasítások támogatását, különösen az új csúcskategóriás chipben.
Összegezve az architektúra általános eredményeit, érdemes megjegyezni, hogy a G92 / G80 óta semmi sem változott drámaian, és az összes számítási egység átlagosan megduplázódott. A fennmaradó változtatások csak ezeknek a blokkoknak a funkcionalitásának finomítását érintették.
Az alábbi táblázat az összes jelentősebb, különböző generációs egychipes megoldás adatait tartalmazza.
Videokártya | GeForce GTX 280 | GeForce GTX 260 | GeForce 9800 GTX | GeForce 8800 GTS | GeForce 8800 GTX |
Mag | GT200 | GT200 | G92 | G92 | G80 |
Tranzisztorok száma, millió | 1400 | 1400 | 754 | 754 | 681 |
Folyamat technológia, nm | 65 | 65 | 65 | 65 | 90 |
Processzorok száma | 240 | 192 | 128 | 128 | 128 |
TMU-k száma | 80 | 64 | 64 | 64 | 32 |
ROP-ok száma | 32 | 28 | 16 | 16 | 24 |
Magfrekvencia, MHz | 602 | 576 | 675 | 650 | 575 |
Processzor frekvencia, MHz | 1296 | 1242 | 1688 | 1625 | 1350 |
Memória frekvencia, MHz | 2214 | 2000 | 2200 | 1940 | 1800 |
Memóriabusz, bit | 512 | 448 | 256 | 256 | 384 |
Memória típusa | GDDR3 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
Memória mérete, MB | 1024 | 896 | 512 | 512 | 768 |
Memória sávszélesség, GB/s | 142 | 112 | 70,4 | 62 | 86,4 |
Felület | PCI Express 2.0 | PCI Express 2.0 | PCI Express 2.0 | PCI Express 2.0 | PCI Express 1.1 |
A DirectX támogatott verziója | 10 | 10 | 10 | 10 | 10 |
Áramfelvétel, W | 236 | 182 | 168 | 140 | 177 |
Xpert Vision GeForce GTX 280
Példaként az NVIDIA új videoadapterét nézzük meg az XpertVision termékkel, bár valójában az összes jelenleg gyártott kártya ugyanabban a gyárban gyártott referenciakártya. Ha egy adott márka mellett dönt, csak a névért és a felszerelésért kell fizetnie.
Felügyelet és túlhajtás
A chip 602 MHz-en működik, míg a shader egységek 1296 MHz-en vannak. A GDDR3 memória effektív 2214 MHz-en (1107 MHz fizikai) működik. De ezek a frekvenciák csak a GPU betöltésekor engedélyezettek. Alapjáraton ezek az értékek csak 300/100/200 MHz (mag/shader tartomány/memória). A terhelés növekedésével a mag 400 MHz-re, a memória 594 MHz-re állítható. De a shader blokkok a megfigyelés alapján csak két diszkrét értéket vesznek fel.
A RivaTuner 2.09 működik új videokártyákkal, de nem érzékeli a ventilátor sebességét. Ezek az adatok a GPU-Z segédprogramban tekinthetők meg. Bár a sebességet a RivaTuner menüből tudod szabályozni, és itt a csúszka helyzete százalékban az éppen aktív sebesség módnak felel meg.
Ami a túlhajtást illeti, az minimálisnak bizonyult. A műtermékekből ítélve minden a hűtéstől függ. Ezenkívül nincs mód a raszteres és a shader tartományok külön meghajtására. Ez a funkció engedélyezve van a RivaTunerben, de még nem működik. A frekvenciák továbbra is szinkronban változnak, vagy akár visszaállhatnak a minimális küszöbértékre. A videokártya 633/1350/2520 MHz-re lett túlhajtva. A mag szerint ez csak 5% -kal magasabb a névleges értéknél (amit nem is lehet túlhúzásnak nevezni), memóriából - 13% -kal magasabb, mint a névleges érték. Tekintettel a videokártya kezdetben nagy memóriasávszélességére, feltételezhetjük, hogy a memória túlhajtása nem játszik szerepet a végső teljesítményben.
Az új GeForce GTX 280 videokártya fő riválisa a többlapkás GeForce 9800 GX2, amely két G92-450 magra épül. Ez a videokártya az új generációs képviselő megjelenéséig a legproduktívabb termék helyét foglalta el. Nézzük meg, hogy egy új egylapkás megoldás legyőzi-e. A legérdekesebb dolog az, hogy a GeForce 9800 GX2 számítási egységeinek teljes száma megegyezik az egychipes GeForce GTX 280-éval.
Az AMD-vel ellentétben, amely a többmagos megoldásokban látja a jövőt, az NVIDIA továbbra is az egychipes kártyák fejlesztésére összpontosít. A GeForce 9800 GX2 megjelenése erőltetett válasz volt a Radeon HD3870 X2-re, hiszen az új generáció fejlesztés alatt állt, és senki nem adja oda a vezető babérjait. Tekintettel arra, hogy az egymagos GeForce 8800GTS 512 MB egyszerűen felülmúlja a Radeon HD 3870-et a teljesítmény tekintetében, az NVIDIA előre ment, és két kártyát kombinált SLI-ben egy házon belül. Kezdetben a GeForce 9800 GX2 életútja nagyon rövidnek kellett volna lennie, de mint alább látni fogjuk, nem szabad nagy reményeket fűzni az új generációhoz, és az "öreg" továbbra is nagyon sikeresen versenyez az új csúcskategóriával. videó adapter.
A GeForce 9800 GX2 képviselőjeként a ZOTAC-tól videókártyát kaptunk tesztelésre.
Felszerelés:
Felügyelet és túlhajtás
A specifikációnak megfelelően ez a videokártya - 602/1512 MHz (mag), 1998 MHz (fizikai 999 MHz) memória frekvencián működik. Ennél a videoadapternél a turbina-hűtő sebességét egyetlen segédprogram sem határozza meg. De a RivaTuner hűtő vezérlő részében a fordulatszám százalékban jelenik meg, és lehetőség van a turbina fordulatszámának beállítására. A ventilátor valamivel nagyobb sebességgel indul, mint a GeForce GTX 280, de a chipek hőmérséklete valamivel alacsonyabb. Az ATITool tesztben a magok hőmérsékletét 83-84°C-on tartottuk.
Zajjellemzőket tekintve a hűtőrendszer a GeForce GTX 280-nak felel meg, vagyis ugyanannyit zúg, de egy kicsit jobban teszi a dolgát.
Ennek a kártyának a túlhajtása nem volt kiemelkedő, különösen, ha figyelembe vesszük a GeForce 8800GTS túlhajtási eredményeit korábbi áttekintésünkben. A vizsgált modell 702/1728/2130 MHz frekvencián (mag/folyam processzorok/memória) stabilan működött. A magasabb értékek miatt a rendszer lefagyott néhány tesztben. A fordulatszámot a maximumra emelték, de ez nem segített javítani a gyorsuláson. A ventilátorra szerelt 120 mm-es ventilátor sem változtatott a helyzeten, bár pár fokkal visszaesett a hőmérséklet. A lefagyások általában az áramhiány jelei, de a próbapadon használt 1 kW-os tápnak bőven elégnek kellett volna lennie.
A videokártyák jellemzőinek összehasonlító táblázataVideokártya | XpertVision GeForce GTX 280 1GB | ZOTAC GeForce 9800GX2 512MB |
Processzor kódnév | GT200 | 2 x G92-450 |
Folyamat technológia, nm | 65 | 65 |
Magfrekvencia, MHz | 602 | 602 |
Unified shader egységek frekvenciája, MHz | 1296 | 1512 |
Az egyesített árnyékoló egységek száma | 240 | 2x128 |
Textúra egységek száma TMU | 80 | 2x64 |
ROP keverő egységek | 32 | 2x16 |
Memória frekvencia, MHz | 2214 | 1998 |
Memória interfész kapacitása, bit | 512 | 2x256 |
Próbapad:
Az előző generációval való összehasonlítás érdekében az előző teszt ASUS GeForce 8800 GTS 512MB eredményeit hozzáadtuk a grafikonokhoz. Ehhez a kártyához a valamivel régebbi ForceWare 175.16 illesztőprogramokat használták.
Teszt eredmények DirectX 9-ben
ORVVADÁSZ. (DX9)
Hagyományosan ez a népszerű hazai lövöldözős játék az első játékteszt.
TimeShift (DX9)
Unreal Tournament 3 (DX9)
Népszerű hálózati lövöldözős játék. Sok más népszerű projektet hoztak létre ennek a játéknak a motorján, így a teljesítmény ebben az alkalmazásban nagyon tájékoztató jellegű.
Call of Duty 4 (DX9)
Az elmúlt év egyik legjobb játéka.
Jelmagyarázat: Isten keze (DX9)
Diablo klón gyönyörű grafikával.
Versenyző: GRID (DX9)
Kiváló autószimulátor gyönyörű grafikával a Colin McRae Rally DIRT motoron.
A tesztekhez szabványos GPU-benchmarkot használtak.
Devil May Cry4 (DX10)
Az első teszt DirectX 10 alatt. Bár a játék új, alacsony rendszerkövetelményekkel rendelkezik.
Crysis (DX10)
A DirectX 10 alatti teszteket a javított 1.2-es verzióban végezték el. Vizsgáljuk meg, beigazolódik-e az a feltételezésünk, hogy a GeForce GTX 280 fő potenciálja a DirectX 10-ben mutatkozik meg.
következtetéseket
Ha szenzációt és áttörést várt az új NVIDIA videoadapterektől, akkor várhat tovább. A G80 megjelenéséhez hasonló áttörés nem történt meg. Az új chip kétszer akkora, mint a jó öreg G92 chip, kisebb fejlesztésekkel a számítási egységeken. Valójában ez azt jelenti, hogy a cég korábbi zászlóshajója a legtöbb játékban két G92-vel megelőzi az újoncot. És ez annak ellenére, hogy a GeForce 9800GX2 ára is alacsonyabb.
Természetesen az új videokártyában van potenciál, az 512 bites busz és a nagy mennyiségű memória segít néha megőrizni vezető szerepét nehéz üzemmódokban. De a probléma ebben van "néha". Ehhez járul még az új grafikus kártya magasabb energiafogyasztása és forró hangulata. A következtetés önmagát sugallja. Ha van olcsóbb, sokszor gyorsabb és kicsit hűvösebb (bár a lapkáinak hőmérséklete alacsonyabb) GeForce 9800 GX2, akkor miért kell más és drágább?
De elég erős érv szól az új modell mellett. A többchipes megoldásoknak vannak bizonyos problémái a szoftveroptimalizálással kapcsolatban. Tesztünk során egyetlen olyan játék volt, ahol egyértelműen látszik, hogy két G92-ben rejlő lehetőségeket nem használják ki. A Legend: Hand of Godban a GeForce 9800GX2 még pár százalékot is veszített magasabb frekvenciájú egychipes elődjéhez képest. Más játékokban a kétlapkás GeForce mindig is felülmúlta a GeForce 8800GTS-t, és néha egészen jelentősen. Tehát az SLI nem olyan ijesztő, mint ahogy azt ábrázolják. Legalábbis 32 biten így mennek a dolgok operációs rendszer. Az x64-en a vélemények szerint az optimalizálással rosszabb a helyzet. Az egychipes megoldások utolsó harcosai felidézhetik a két chipes kártyák tipikus "lemaradásait". Igen, van ilyen. De az összes tesztelt játék közül ez egyértelműen csak a Crysisben volt észrevehető. Más játékokban a játékmenet, ha nem is ideális, de rövid távú teljesítménycsökkenés nem észrevehető. A videokártya erős, és még ha 100-ról 50 FPS-re csökken is, a játékosok 90% -a egyszerűen nem fogja érezni.
Az ilyen kellemes következtetések hátterében még egy kérdés merül fel. Miért van akkor szükségünk a GeForce 9800GX2-re? Ha az árához képest nyugodtan vehetsz két GeForce 8800 GTS-t és rakhatod SLI-be. Ebben az esetben a kártyák jobban hűthetők, ami még több túlhajtást tesz lehetővé. Végül is a GeForce 9800 GX2 gyakorlatilag semmiben sem különbözik attól az SLI-től, amelyiken beszerezhető alaplap.
Ha összehasonlítjuk a ma áttekintett termékek árait teljesítményükkel, akkor egyértelművé válik, hogy egy 8800GTS-hez képest 50-100%-os teljesítménynövekedés 2-3-szoros áremelkedést jelent. Ebben az esetben elviselhetetlen zajszintű tűzhelyet kap. Fizetés 500-700 USD hogy egy csúcsgyorsító bedugva tudjon játszani? Félrebeszél. Tehát azonnal készüljön fel a szabványos hűtőrendszer megváltoztatására, lehetőleg CBO-ra.
Kéz a szíven érdemes elmondani, hogy az olyan termékek, mint a GeForce 9800 GX2 és a GeForce GTX 280 nem a legvonzóbb opciók „ár/teljesítmény” szempontból. De a High-End mindig is ilyen volt. Túlfizetünk a mostani vásárlási lehetőségért, ami egy év múlva fele annyiba fog kerülni. De mégis, ilyen pénzért egy kész terméket szeretnék kapni, és nem a rajongóknak való konstruktőrt. Ha nem törődnek a pénzügyekkel, és mindig is arról álmodoztak, hogy két vagy három nagy teljesítményű videokártyából SLI-t szerelnek össze, és emellett CBO-t is szerveznek, akkor a megfontolt modellekre van szüksége. Még nincsenek erősebbek és melegebbek. :)
Az egyik következő cikkben megpróbáljuk bemutatni az AMD és az NVIDIA új, nagy teljesítményű videoadaptereit. árkategória. Hasonlítsuk össze őket ezekkel a csúcsmodellekkel, és derítsük ki, melyik modell a leghatékonyabb ár/teljesítmény arányban.
Köszönetet mondunk az alábbi cégeknek a tesztberendezések biztosításáért: