2024. április 26., péntek

Gyorskeresés

9600GT – hol a szűk keresztmetszet?

  • (f)
  • (p)
Írta: |

Tényleg a 64 shader a 9600GT szűk keresztmetszete? Keressük meg a választ.

[ ÚJ TESZT ]

Tényleg a 64 shader a 9600GT szűk keresztmetszete? A három külön állítható órajel-tartomány segítségével keressük a választ.

0. Napirend előtt

A tesztben szereplő beállításokkal készült mérések nagy része egy másik teszthez készült (ami pihen, amíg nem sikerül egy 8800GT-t szereznem) – ezért a táblázatokban nem a megszokott „mennyivel emeljük meg a 650MHz-et” típusú számok szerepelnek. A teszt végeredményének szempontjából ennek nincs jelentősége – az elvégzett néhány kontroll mérés is ezt igazolja.

1. Bevezető

A 9600GT megjelenése előtt kapott kígyót-békát a 64 stream processor miatt – mivel a kártya elméleti számítási teljesítménye kb. a 2600XT-vel van egy szinten, nem sokan vették komolyan az nVidia azon állítását, hogy a 9600GT a 3850-nel fog versenyezni. A megjelenés aztán elhallgattatta ezeket a hangokat, de hamarosan újraéledtek abban a formában, hogy a 9600GT a 2008 év végén megjelenő játékokban már lényegesen gyengébben fog teljesíteni, mint a 3800-as széria két tagja.
Mivel az imígyen beharangozott játékokból még mindig nem érhetők el demok sem, addig azt lehet megvizsgálni, hogy a 9600GT teljesítményének mennyiben szűk keresztmetszete jelenleg a 64 SP. Lássuk akkor!

2. Teszt konfiguráció és tesztmódszer

Ezúttal a platform beállításai az egész teszt során fixek voltak, csak a videokártya órajele változott. A konfiguráció:

Látható, hogy a VGA 4 külöböző beállítással üzemelt: az első (halványzöld) az alapbeállítás, ehhez viszonyul majd a másik három. A többi sorra a core (kék), a shader (narancs) és a memória-órajel (zöld) önálló hatásának vizsgálatára szolgál. A teszteredményekből kiszámítható, hogy az egyes órajelek változtatása hogyan hat a teljesítményre – a kapott arányokat az összehasonlíthatóság érdekében 10%-ra normáltam, azaz pl. ha 20%-os órajel-változás 8%-os változást hoz a teljesítményben, akkor a normált eredmény 4% lett.

8 játék szerepel a tesztcsomagban (zárójelben a használt beállítások):
Assassin’s Creed 1.0 (Maximum beállítás)
Bioshock 1.0 (Maximum beállítás)
Crysis 1.2 (High beállítás)
F.E.A.R. 1.08 (Maximum beállítás, 4xAA mellett Soft Shadows nélkül)
Oblivion 1.2.0416 (Maximum beállítás – HDR)
Race Driver: GRID 1.0 (Maximum beállítás)
Rainbow Six: Vegas 1.04 (Maximum beállítás)
World in Conflict 1.0.0.0 (Maximum beállítás, Debris physics kikapcsolva)

Cél volt a minél VGA-izzasztóbb beállításokat használata, ettől csak két eltérés van – a Crysis esetében a magasabb beállítások már slide-show-t eredményeznek, a World in Conflict esetében pedig a törmelékekkel kapcsolatos fizikai számítások mellőzése a CPU életét könnyíti meg valamelyest.

Külön-külön szekció van az élsimítás nélküli és az élsimításos beállításokra – mint látható lesz, komoly különbség van a két eset között abban a tekintetben, hogy melyik órajel-tartományra érzékenyebbek.

Minden játék mind a 4 órajel-konfigurációval le lett mérve, és esetenként három mérés készült – a táblázatokba ezek átlaga került.

3. Tesztek és eredmények

Az alábbiakban láthatóak a mérések eredményei és a belőlük számított %-os eltérések. A mért fps-ekből nem volt értelme grafikont készíteni, mert nagyon közel vannak egymáshoz a számok – annál inkább érdekes grafikusan ábrázolni a kapott %-os eltéréseket.

3.1 1280x1024-es felbontás, élsimítás nélkül

Az AA nélküli tesztekben arra lehetett számítani, hogy a memória-sávszélesség hatása minimális lesz, és a shader-órajel növelése fogja messze a legjobb eredményt hozni a legtöbb játékban.
A mérések eredményei:

És a belőlük származtatott %-ok:

Egy kis magyarázat a grafikonhoz: a “csövek” egyes elemein lehet látni, melyik órajel-tartomány változásának mekkora hatása van. A három “cső” összege 10%, ha teljes egészében a VGA a limitáló tényező – itt ez a helyzet, csak a mérések kis mértékű pontatlansága egy kicsit szétszórja az eredményeket.

A grafikon egy ponton meglehetősen sokkoló hatású – a shader-zabálóként közismert Vegas-t igen mérsékelten hatja meg a shader-órajel emelése, annál inkább szereti a core órajelet. Az okok kinyomozása további méréseket fog igényelni, és lehet, hogy a 8800GT-s tesztekre is szükség lesz rá – később visszatérek rá.
A Bioshock és a GRID nagyjából az elvártnak megfelelően viselkedik, a többi játékban a shader órajel hatása valamivel erősebb a többieknél, de sehol sem igazán domináns. A memória-órajel és a core órajel hatása hol erősebb, hol gyengébb, az átlagot tekintve kb. egyforma – szó sincs arról, hogy az 57.6GB/sec sávszélesség bőven sok lenne a 9600GT-nek élsimítás nékül.

Megjegyzés: az élsimítás nélküli tesztből kimaradt az Assassin’s Creed és a World in Conflict – mindkét esetben arra utaltak a mérések, hogy a platform erősen visszafogta a videokártyát, ezért ezekből az eredményekből nem lehetett következtetéseket levonni.

3.2 1280x1024-es felbontás, 4-szeres élsimítás

Az élsimítás bekapcsolásával várható volt, hogy a memória szerepe megnő, ill. mivel az MSAA-t teljes egészében végző ROP-ok a core órajelen futnak, ennek szerepe is komolyabb kellett volna, hogy legyen – természetesen a shader órajel rovására.
Az eredmények:

A %-ok pedig így festenek:

A grafikon meglehetősen érdekes képet mutat – lényegében két kategóriára oszlik a 6 játék.
A 2008 előtti játékok igen hasonlóan viselkednek, a 10% memória-órajel-változás mindenhol 4%-ot bőven meghaladó teljesítménybeli változást hoz, a maradékon a core és a shader órajel osztozik – a 2007 előtti játékokban a core, a 2007-es játékokban már a shader órajel hatása erősebb.
A két 2008-as játék gyökeresen más képet mutat: a shader órajel hatása erősen domináns, a GRID esetében még a memória szóhoz jut valamennyire, az Assassin’s Creedben viszont szinte csak a számítási kapacitás számít.

Megjegyzés: az élsimításos tesztben nem szerepel a Bioshock és a Vegas – ez a két játék nem támogatja az élsimítást, így a driverből rájuk erőltetni sincs túl sok értelme, nem adnak olyan eredményt, amiből messzemenő következtetéseket lehetne levonni.

4. Konklúzió

Úgy tűnik, 2008-ban változott egyet a világ – míg a korábbi játékok (különösen élsimítással) csak úgy falták a memória-sávszélességet, az ideiek valamelyest takarékosabbnak tűnnek. A kisebb sávszélesség-igény hatására pedig kezd láthatóvá válni az a trend, amely szerint a játékok egyre erősebben fognak támaszkodni a kártyák számítási teljesítményére, szemben pl. a textúrázó-kapacitással.
Az Interneten található számtalan teszt azt mutatja, hogy a korábbi játékokban 4xAA mellett a 9600GT alig van lemaradva a G92 alapú testvereitől. A 2008-as játékok esetében (ill. a korábbi Unreal Engine 3 alapú játékokban) már más a helyzet – a 8800GT-vel összehasonlítva pl. 10%-ról 30%-ra nőtt a differencia. Vajon tud-e ez a trend tovább folytatódni? A Bioshock és a főleg a Vegas tesztek alapján akár igen is lehet a választ, hiszen ha ebbe az engine-be további számításigényes shader-kódok kerülnek, akkor a shader órajel súlya tovább nőhet, még jobban széthúzva a jelenlegi 30%-os különbséget. Az Assassin’s Creed engine-jében viszont a 30%-os különbség kb. már a határ – ennél dominánsabban már nemigen veheti ki a shader órajel a részét a játék teljesítményéből.
Látható tehát, hogy még a shader-igényesebb játékmotorok esetében is komoly különbség lehet abban, hogy mennyire limitálja a 9600GT teljesítményét a 64 stream processor számítási kapacitása. Mivel így a sokat emlegetett növekvő ALU:TEX arány mellett is van lehetőség a 9600GT-n jól működő kódot írni (ezt mutatja a két tesztelt 2008-as játék is), a konzol-PC multiplatform keretek által amúgy is korlátozott játékgyártók minden bizonnyal figyelembe veszik, mennyi ilyen kártya szaladgál a piacon – ezért egyelőre semmi oka a 9600GT tulajdonosoknak sötéten látni a jövőt.

5. Köszönetnyilvánítás

A tesztcsomag instrumentálásában nélkülözhetetlen segítséget nyújtott az AutoIt v3 – áldassék érte Jonathan Bennett keze! (http://www.autoitscript.com/autoit3/)

Állandó inzertként pedig köszönet The DJ-nek és t|-|om-nak a képefeltöltő oldalért! (http://www.dj-beat.hu/phimage)

Hirdetés

Copyright © 2000-2024 PROHARDVER Informatikai Kft.