2024. április 20., szombat

Gyorskeresés

Radeon HD7900 - játék a számokkal

Írta: | Kulcsszavak: HD7950 . HD7970 . Tahiti

[ ÚJ BEJEGYZÉS ]

A videokártyák, pontosabban a GPU-k felépítésének mérésekkel megtámogatott elemzése a mai napig méltatlanul mellőzött terület az online szakirodalomban. Az igényesebb oldalak az új architektúrák megjelenésekor rendszerint korrekt és követhető bemutatót adnak az újdonság sajátosságairól, ill. a változásokról a korábbi generációhoz képest, jobb esetben még a konkurenciával is vonnak párhuzamokat - viszont sajnos itt jellemzően megáll a dolog, arra már nemigen készülnek mérések, hogy feltárják, az új architektúra sajátosságai hogyan hatnak a játékokban elért teljesítményre.

Pedig néhány extra tesztsorozat alapján egész jó áttekintő képet lehet kapni arról, hogy az újonnan érkezett, újabban sokmilliárd tranzisztorból építkező GPU mit szeret, ill. mit nem. Régebben csináltam számos ilyen mérést és elemzést, sajnos az utóbbi időben erre nincs lehetőségem - de ettől még a (meglehetősen ritka) GPU-megjelenéseket érdeklődve figyelem, és igyekszem az oldalak méréseiből ezekre a kérdésekre válaszokat találni. Éppen ezért roppant kellemesen meglepetés volt, hogy egy bizonyos külföldi tesztoldal (nevezzük mondjuk AnandTech-nek) a HD7950-es VGA megjelenése kapcsán olyan tesztsorokat tett közzé, amelyek érdemben minden olyan információt tartalmaznak, ami alapján a HD7970 és HD7950 szíveként funkcionáló Tahiti chip lelkivilágába lényegesen mélyebb betekintés nyerhető. Azon nyomban nekiláttam ezeket rendszerezni és kielemezni - aztán, amikor már grafikonokat is gyártottam belőlük, felmerült az ötlet, hogy az eredményeket közreadom. Íme!

1. Röviden a Tahiti architektúrájáról

Míg jónevű online újságíró kollégáim igen alaposan kielemezték, miben változott a Tahiti a Caymanhoz képest, ennél messzebb nem mentek. Bár a két generáció szomszédos volta révén nyilván nem hagyható ki az összehasonlítás, mindegyik elemzésből látható, hogy a két GPU közötti változások kissé sántítanak - a Tahiti egyáltalán nem tekinthető egy olyan fejlődési folyamat következő lépcsőjének, amelyen felsorakoznak az RV770, Cypress, Barts és Cayman chipek. Vagy, hogy kevésbé legyen indirekt a dolog, az RV770 - Cypress - Tahiti fejlődési görbére egyáltalán nem illik rá a Barts és a Cayman. Közismert tény, hogy a Barts és a Cayman "elferdülése" sokban köszönhető a 32nm-es gyártástechnológia elmaradásának - éppen ezért a Tahiti felépítéséről szerintem akkor kapunk jó képet, ha a chipet a Cypress-szel hasonlítjuk össze, helyenként a trendek vizsgálata érdekében bevonva az RV770-et. Ha minden jól megy, a későbbiekben összeütök egy ilyen cikket is - egyelőre most fókuszáljunk a Tahitire és az ő tudására.

2. Tesztkörnyezet, körülmények, egyebek

Ahogy fentebb utaltam rá, az elemzéshez felhasznált mérések az AnandTech AMD 7950 tesztjéből származnak, ezért a tesztekkel kapcsolatos információk ott mind megtalálhatók.
Miután az elemzés jellege lehetővé teszi, hogy csak %-os eltéréseket közöljek két konfiguráció között, a konkrét fps-értékeket nem vettem át - természetesen ezek is megtalálhatók az eredeti cikkben.

3. Első kísérlet - végre 384 bit!

Úgy gondoljuk, a VGA-k iránt érdeklődő társadalom egy emberként törölte meg verejtékező homlokát, amikor hivatalossá váltak a HD7970 specifikációi - hosszas időhúzás és számtalan felháborodott rant után az AMD végre szakított a 256-bites memóriabusszal, és rátett a cső szélességére egy bőkezű 50%-ot. Első vizsgálatunk azt hivatott demonstrálni, hogy ez az igencsak komoly extra sávszélesség hogy hat a chip viselkedésére - különösen annak tükrében, hogy a legnagyobb fogyasztónak számító ROP-ok száma nem változott. Íme az eredmények:

Hát szó se róla, nagyot változott a helyzet. Míg a Cypress esetében 10% memória-órajel emeléssel akár 5% extra teljesítményt is lehetett nyerni, és a Cayman is 3-4%-kal gyorsítható volt ily módon, a Tahiti esetében már csak 1-2% nyerhető azzal, hogy 1375MHz-en szaladnak a memóriák 1250MHz helyett. Különösen érdekes a Portal 2 eredmény SSAA-val, ahol a változás érdemben mérhetetlen - az SSAA egyáltalán nem kíméli a sávszélességet, viszont minden bizonnyal egyszerre nagyobb adatmennyiségeket mozgat, és ezért kitűnően profitál a 384-bites memóriabuszból.

Ha a fenti eredményeket kivetítjük nagyobb skálára (pl. egy 30%-os emelésre), akkor azt látjuk, hogy a magas gDDR5 órajellel együtt járó magas fogyasztásért cserébe a Cypress tud előrelépni, a Cayman is valamivel jobb lesz, viszont a Tahiti észrevehetően nem gyorsul. Az elméletet tehát sikerült igazolni, a sokkal szélesebb memóriabusz végre megoldotta a Radeon kártyák krónikus sávszélesség-éhségét.

3. Második kísérlet - akkor tuningoljuk a core órajelet!

Ha a memória-órajel tuningolásával kevéssé érünk célt, akkor természetesen a core órajelre érdemes koncentrálni - szerencsére ezen a téren jó hírük van a Tahiti chipeknek. Lássuk, hogy reagálnak a játékok egy mérsékeltebb emelésre:

Tekintetbe véve a memória-tuning eredményeit, 3 játék van, amivel nem lehetünk igazán elégedettek - a METRO, a Dirt 3 és a Batman nem hozza az elvárható gyorsulást. Ennek oka, hogy bár Anandék meglehetősen bivaly processzorral tesztelnek, minimális platform (elsősorban CPU) limitáció szinte mindenhol van - ezen három game esetében pedig kicsit jobban érződik. Egyedül talán a METRO lehet meglepetés - bár nagy VGA-killer a játék, egyes helyeken kissé optimalizálatlan a CPU-használata, ezért a méréshez kiválasztott jelenettől függ, hogy mennyire aknázható ki (vagy inkább mérhető ki) az erősebb VGA hatása.

Érdemes tehát tuningolni a core órajelet, mert a HD7900-asok meghálálják - és bár erős CPU kell alájuk, a tesztben szereplő i7-3960X nem a szükséges minimum követelmény, bármelyik 4 magos Sandy Bridge megfelelő lehet, ha egy kicsit megkergetjük. Gyengébb CPU-k esetén sincs nagy baj, de arra azért kell számítani, hogy a tuningból egyes játékokban kevesebb fog realizálódni.

4. Harmadik kísérlet - HD7970 vs HD7950

Végére maradt a legérdekesebb összevetés - megnézzük, hogy azonos órajelek mellett az enyhén kasztrált Tahiti GPU hogy viselkedik. Itt egy kicsit kellett játszani a forrásadatokkal - a 7970-es órajelei 925/1375, míg a tesztben szereplő XFX 7950-é 900/1375. Ez a különbség nem nagy, de mivel a két GPU-változat között elég kicsi a sebességkülönbség, ennyi is eltorzítaná a következtetéseket. Ezért a HD7950@925/1375 eredmények interpolálással álltak elő - az előző tesztben láttuk, hogy pl. a Battlefield 3-nál a 12.5%-os core órajel emelés 9.8%-kal több fps-t jelentett, ezért a 900MHz helyett 925MHz (+2.78%) 2.2%-kal több fps-t hozna. Így már pontosak lesznek a konklúziók.

Az AMD a Tahiti-t megelőző 3 architektúrában ugyanazt a stratégiát alkalmazta az 50-es chipeknél - letiltott néhányat a shader tömbökből és a hozzájuk csatolt textúrázókból, míg a ROP-okat, a memóriabuszt és a chip többi részét érintetlenül hagyta. A Tahiti chip esetében 4 ALU/TEX blokk került letiltásra a 32-ből, így a HD7950 1792 ALU-val és 112 textúrázóval rendelkezik. Ennél a HD7970-ben 14.3%-kal van több, ami egy, az adott játék igényeihez kiegyensúlyozott felépítés esetén jó közelítéssel 7-8% többletteljesítményt jelent. Ennek tükrében nézzük a következő grafikont:

Ahogy az kitűnően látszik, egy játék sem gyorsul a fenti 7-8%-nál többet, 4 játék kb. ilyen mértékben mutat több fps-t, 4 játék csak jóval kisebb mértékben gyorsul (3-5%), végül a Batman egyáltalán nincs meghatva a több ALU-tól és textúrázótól.

A fentiekből az következik, hogy (nem meglepő módon) a Tahiti GPU az eddigi hagyományokat folytatva az ALU/TEX szekcióban a legkövérebb, és az első kísérletből az is kiderült, hogy a chip legvégén csücsülő memóriabusz is kényelmesen elegendő szélességű. Ezért, szintén a szokásoknak megfelelően, a Tahiti chip legnagyobb gyengéje a ROP-kapacitás. Ezen egyfelől nem csodálkozunk, hiszen a compute-orientált felhasználásban a ROP-ok csak a ballaszt szerepét tölti be - másrészt viszont fenntartjuk azon véleményünket, hogy a manapság elterjedt szörnyen post-process intenzív játékmotorokban a GPU-ból kispórolt 16 ROP jelentős (15-25%-os) teljesítménynövekedést hozna. Aki nem hiszi, járjon utána a Barts chipnek. Csak az AMD tudja, hogy miért "szúrja el" szinte az összes GPU-ját az erőltetteten szűk back-enddel...

Fogyasztói szempontból teljesen más jelentőséggel bírnak a fenti eredmények. Aki játék célból a HD7970 helyett HD7950-et akar venni, annak felesleges a hiányzó ALU/TEX blokkok miatt aggódnia - inkább az lesz a fontos kérdés, hogy melyik GPU milyen órajeleket bír. Ha pedig a leendő HD7900 tulajdonos nem akar tuningolni, akkor azt érdemes megjegyezni, hogy a gyárilag húzott, 900/1250-es órajelen üzemelő HD7950 mindenhol 10%-on belül van a referencia HD7970-hez képest - ez alapján az ár, az abszolút teljesítmény és a fogyasztás háromszögében már könnyű dönteni, melyik az ideális kártya számunkra.

5. Konklúzió

A fenti eredmények arra utalnak, hogy a rendkívül hangzatos kijelentés, miszerint a Tahiti az AMD Fermije, egyáltalán nem áll távol az igazságtól. A compute feladatokhoz elengedhetetlen ALU-kapacitás, valamint a szintén fontos memória-sávszélesség hegyekben áll a chipben, míg a többi területeten annyit tartalmaz a GPU, amennyit feltétlen muszáj. Ez egyfelől érthető, hiszen a GPU-ban lapuló 4.3 milliárd tranzisztor így is borzalmasan sok - másfelől viszont az AMD reklámszövegei, amelyek a konkurencia megszégyenítéséről zengedeznek, egyáltalán nem állják meg a helyüket. Szent meggyőződésünk, hogy ha a memória-sávszélességgel egyenlő arányban nőtt volna a ROP-ok mennyisége, akkor a HD7900-asok sokkal gyalázkodóbban viselkednének - így viszont be kell érnünk annyival, hogy a HD7970 a leggyorsabb egy GPU-s kártya, a HD7950 pedig a korábbi egy GPU-s király, a GTX580 teljesítményét hozza, lényegesen kellemesebb működési paraméterekkel.

Köszönetnyilvánítás

Ez az elemzés nem jöhetett vona létre, ha nincs Ryan Smith kitűnő cikke a HD7950-ről az anandtech.com-on. Respect! :R

  • Nem lehet hozzászólni
Copyright © 2000-2024 PROHARDVER Informatikai Kft.