Hirdetés

A 64bit/DDR és a 128bit/SDR viszonya

Bevezetés, szereplők

BEVEZETÉS

Sokszor elgondolkodtam azon, vajon a papíron azonos sávszélességet kínáló SDR és DDR memóriák a valóságban hogyan viszonyulnak egymáshoz, azaz a DDR memória a fele olyan bitszélességű buszon képes-e ugyanannyi adatot átpumpálni az SDR memóriához képest? Látatlanban sejtettem a választ, de kíváncsi voltam, hogy a valóságban mennyi az eltérés.

Anélkül, hogy belemennék a technikai kifejtésbe (arról bárki talál anyagot a Neten), annyit mindenképpen tudni kell, hogy az SDR SDRAM esetén órajelenként egyszer történik adatmozgás, míg a DDR SDRAM memóriánál (pl. PC2100, DDR266) kétszer: az órajel felfutó élén és lefutó élén is, így azonos alapórajel mellett kétszer annyi adatot tud továbbítani, mint az SDR. Ebből következően a 64 bites DDR memória elméleti sávszélessége azonos a 128 bites SDR memória sávszélességével. Természetesen ebbe beleszól a kétféle megoldás késleltetése (a DDR memóriáé magasabb).

A teszt megvalósításához beszereztem négy darab kártyát: ezek közül kettő GeForce 2 MX, kettő pedig GeForce 4 MX. A legnehezebben megszerzett kártya a GF2 MX DDR volt, mert nagyon ritka (főleg a márkás típus), valamint a GF4 MX SDR, mert az sem (volt) egy elterjedt darab. Persze normál GF2 MX SDR és GF4 MX DDR annyi van, mint égen a csillag.

Hirdetés

Szereplők

Creative 3D Blaster Annihilator 2 MX

Az első versenyző a manapság leginkább csak audió termékeiről nevezetes Creative-tól származik. A cég valamikor a '90-es évek második felében kezdett el VGA kártyákat is forgalmazni, és egészen a GeForce FX éráig jelen volt az üzletágban. Pontosan nem tudom, hogy mely cégek gyártották a Creative VGA kártyákat, de az FX-eknél átcímkézett MSI modelleket lehetett vásárolni a márkanév alatt.

A Creative úgy döntött, hogy a saját GeForce 2 MX kártyáját 64 bites memóriabuszon működő DDR memóriával ellátva dobja piacra. A kártya alacsony profilú kialakítást kapott, mindössze egy D-SUB kivezetés található rajta, illetve meg van a helye egy esetleges DVI kimenetnek is. Az MX-eken elterjedt TV-outnak még az előkészítését sem lehet látni.

A kártya hozzám hűtőborda nélkül érkezett, azaz gyárilag nem rakott rá hűtést a Creative. El nem tudom képzelni, hogy miért, hiszen nem nagyon volt a piacon olyan GF2 MX kártya, ami valamilyen passzív, netán aktív hűtéssel ne rendelkezett volna, ráadásul az általam alkalmazott borda is nagyon forró volt használat közben. (Korábban azért már találkoztam egy OEM által, csak számítógéppel együtt forgalmazott GF2 MX-szel, azon sem volt borda.)

A kártya 175 MHz GPU és 143 MHz (DDR 286 MHz) memória sebességen működik. A memória Hyundai márkájú, időzítése 7 ns, ami pontosan megfelel a kártya gyári memória beállításának, így a Creative teljes mértékben kihasználta a memória IC specifikációját a sebesség meghatározásakor. Aztán hogy az előre megtervezett értékekhez vásárolták a 7 ns memóriát, vagy ez volt akkor éppen olcsón, és ehhez lőtték be a kártya specifikációját, már nem tudni. Mindenesetre számomra az lett volna a logikus, hogy 6 ns memóriákat tesznek a kártyára, amivel a többi MX kártyát, amelyek 166 MHz SDR memóriával és 128 bittel készülnek, legalább elméletben be tudja fogni. Persze ha a Creative kifejezetten olcsóbb kártyát akart gyártani, akkor ezzel a megoldással el tudta érni a célját. (És valószínűleg így volt, mert az alsóbb kategóriákban kifejezetten törekedett az olcsóságra).

ASUS AGP-V7100(T)

A másik GeForce 2 MX kártya az Asus-tól származik. A Creative kártyához képest ez a korának megfelelően teljes kiépítésű VGA, amely rendelkezik egy D-SUB és kétféle TV kimenettel (a DVI ekkor még ritka volt és kevésbé igényelt).

Ez a kártya már gyárilag rendelkezik egy méretesebb passzív hűtőbordával: az Asus nem sajnálta azt a néhány centet, amibe a hűtés került, így növelve az üzembiztosságot és élettartamot.

A kártya órajelei 175 MHz (GPU) és 166 MHZ (RAM). Ez utóbbit a GF2 MX DDR kártyához igazítva visszavettem 143 MHz-re. Ezen az MX-en is Hyundai márkájú a memória, persze ez SDR és időzítése 6 ns, ami megfelel a gyárilag beállított 166 MHz-nek.

AOpen MX440 8X-DV64(A4)

Az AOpen fénykorában szintén komoly VGA kinálattal volt jelen a piacon. Az S3 ViRGE chiptől kezdve a 3dfx Voodoo-kon át a GeForce-ok több generációjáig sokféle videó chippel épített kártyákat, legutolsó sorozata az Nvidia NV4x GPU-kra épült. Jelenleg már nem gyárt sem VGA kártyákat, sem alaplapokat.
Mint több más gyártót, az AOpent is elérte a gyenge minőségű kondenzátorok átka: az alaplapokon és a VGA kártyákon is tönkrementek a kapacitorok. A tesztben szereplő kártya sem kivétel, de a képeken retusáltam a hibás alkatrészt.

A kártya minden szükséges kimenettel rendelkezik, ami a korának megfelelően igényelt volt. Mivel LP kialakítású az eszköz, a D-SUB kimenet egy szalagkábellel van megvalósítva. A kártyán egy nagyméretű hűtőborda található, amely az előoldali memóriák fölé nyúlik, de azokat nem érinti, nem hűti. A kártya tetszetős fekete színben pompázik, nagyszerűen megy a korabeli fekete AOpen Pentium III és Pentium 4 alaplapokhoz.

Az AOpen MX440 már 8xAGP-t is tud, köszönhetően a rajta helyet kapó NV18 GPU-nak, amely 275 MHz-en működik alapból. A tesztben a másik GF4 MX kártyához igazodva 250 MHz-re állítottam be a GPU sebességét.
A memória 5 ns A-Data, amely 200 MHz-re (DDR 400) van hitelesítve, azonban csak 190 MHz-re van beállítva gyárilag. Ezt is visszavettem 166 MHz-re, igazodva az Abit Silurohoz.

ABIT Siluro GF4 MX420 SD

Végül, de nem utolsó sorban egy másik viszonylag ritka kártya, az Abit MX420 kerül bemutatásra. De hopp, számoljunk csak! Négy gyártó termékét teszteltem, és azok közül három már nem gyárt VGA kártyát! Uh, ez szíven ütött! Ráadásul az elmúlt 10 évben favoritommá vált Abit is köztük van, aki nem csak a VGA piacról vonult ki, hanem mostanra az alaplapok piacáról is, hasonlóan az AOpenhez (és az Epoxhoz, és a Chaintechhez, és a többihez).

A Siluro hasonlóan a többiekhez, szintén low-profile kialakítást kapott, ami még inkább hangsúlyozza a kategóriáját. Egy D-SUB és egy TV-out található rajta, a hűtését pedig egy különleges formájú, fém színű kerek hűtőbordával oldotta meg az Abit.

Az MX420 memóriája 6 ns Hynix gyártmány (érdekesség: a 4 kártyából 3 Hyundai/Hynix memóriával van szerelve), ez meg is felel a kártya gyári memória órajelének, ami 166 MHz. Az NV17 GPU 250 MHz-re van beállítva.

Tesztkonfiguráció, Megjegyzések

Tesztkonfiguráció

Az alábbi táblázatban összefoglaltan megtalálható minden fontosabb adat a tesztelt VGA kártyákról:

A teszt alapjául szolgáló hardverek:

- AMD Athlon XP 2000+ (1666 MHz, Palomino)
- Abit KT7A 1.3
- 2 x 256 MB PC133 CL3 SDRAM
- Maxtor DiamondMAX 8 40GB ATA133
- LG GSA-4161B

- Creative 3D Blaster Annihilator 2 MX
- ASUS AGP-V7100(T)
- AOpen MX440 8X-DV64(A4)
- ABIT Siluro GF4 MX420 SD

Operációs rendszer és meghajtó szoftverek:

- Windows Millennium Edition
- DirectX 9c
- VIA 4in1 4.43 retro chipset driver
- Nvidia Forceware 56.64
- FRAPS 1.9D

Teszt- és játékprogramok:

- 3DMark 2000 v1.1 (1024*768, 16-32 bit)
- 3DMark 2001 SE b330 (1024*768, 32 bit, default)
- VULPINE GLmark (640*480, 32 bit, low quality)
- TreeMark (1024*768, 32 bit)
- PowerVR TempleMark (1024*768, 32 bit)
- PowerVR VillageMark (1024*768, 32 bit)
- Quake III demó v1.11 (640*480, 800*600, 1024*768, 16-32 bit, high quality)
- Unreal Tournament v451 (640*480, 800*600, 1024*768, 16-32 bit, high quality)
- NFS Porsche Unleashed demó (640*480, 800*600, 1024*768, 16-32 bit, high quality)

Megjegyzések

A tesztben nem mértem meg a kártyák sebességét élsimítással. Valószínűleg azzal még inkább kijöttek volna különbségek, de ezek nem azok a kártyák, amiket érdemes lett volna antialiasing alkalmazásával használni. Anno én is csak a GeForce 4 Ti sorozattal kezdtem használni ezt a funkciót.

A Unreal Tournament játék timedemoval történő mérése nem volt zökkenőmentes. Maga a tesztelés nem okoz gondot: egy rögzített demó fájlt lehet lejátszani ugyanúgy, mint a Quake III esetében. Letöltöttem az utbench.dem fájlt, bemásoltam a fájlt az Unreal Tournament gyökérkönyvtárába, majd az alábbi konzolparancsokkal futtattam a timedemot:

timedemo 1
demoplay utbench noframescap timebased

A timedemo az Enter lenyomása után elkezd futni, az események sora megjelenik konzolon. Maga a rögzített demó egy CTF meccs, amely több perces menet, de a timedemo jellegéből adódóan a gép sebességének függvényében fut le gyorsítva. A teszt végén a konzolban megjelenik a minimum, a maximum, és az átlagos FPS érték. Magát a meccset végig lehet nézni, ESC-vel kilépve a konzolból és újabb megnyomásra belép a demó grafikus megjelenítésébe.
Rájöttem, hogy ha a GUI-n maradok a timedemo futtatása közben, akkor kevesebb FPS-t kapok, mint ha végignéztem volna a tesztet. Ez nagyon fontos dolog, mert torzak lesznek az eredmények, ha egyik kártyánál GUI-val fut a teszt, másiknál meg 3D megjelenítéssel. Erre oda kell figyelni!

A tesztelésbe bevontam a Need For Speed Porsche Unleashed demóját is. Ennél a programnál volt egy kisebb probléma, mivel alapból nem lehett 32 biten 640*480 felbontás fölé menni. A neten körülnézve megtaláltam a megfelelő megoldást, és egy kis trükközéssel (új 3DSetup és D3D fájlok a játékhoz) megoldottam a megfelelő felismertetést, és előjöttek az addig rejtett 32 bites felbontások.
A játék ideális volt a méréshez: egyetlen pálya (Normandia), egyetlen autótípus (911 Carrera), ugyanazok a feltételek minden futtatásnál. Igaz, hogy ebben nem volt beépített benchmark, de a FRAPS segítségével ki tudtam számolni az átlag FPS-t, így kapva meg az eredményt.

Szintetikus 3D tesztek

3DMark 2000 v1.1

A kártyák igazi hazai pályájának tekinthető DirectX 7-es benchmarkot kétféle beállítással futtattam, 1024*786 felbontáson 16 bites (default) és 32 bites színmélységgel.

A grafikonon szépen kirajzolódik az SDR kártyák előnye: a kettes sorozatnál 3,4 - 4%, a négyes sorozatnál pedig 1,8 - 2,5% a sebességbeli különbség a 128 bites kártyák javára.

3DMark 2001 SE b330

A DirecX 8-as tesztprogramot default beállításokkal alkalmaztam, azaz 1024*768 felbontáson 32 bites színmélységgel.

A GF2 MX SDR kártya 4 százalékkal teljesített jobban, mint DDR-es társa. A nagyobb kártyáknál a különbség már csak 1,6%.

TreeMark

A TreeMark nevű tesztprogram a GeForce 256 kártyák T&L egységének sebességét volt hivatott demonstrálni két előre beállított bonyolultságú jelenettel. Az egyszerűbbik közel 36.000 poligont tartalmaz 4 fényforrással, míg a komplex jelenet 128.000 poligonnal és 6 fényforrással dolgozik. A teszt 1000 képkockát renderel le timedemo jelleggel, azaz a képkockák száma osztva a futási idővel a kapott átlag FPS.

A kisebb GeForce kártyáknál mondhatni nincs különbség, mindkettő egyforma értékeket produkált. A négyeseknél az SDR-es kártya a Simplex tesztben fel tudott mutatni 1,5% előnyt, de ez eltűnt a Complex tesztnél, ahol feltehetően a T&L motor teljesítménye a szűk keresztmetszet, a memória sávszélesség nem szól bele az eredménybe.

VULPINE GLmark

A Vulpine GLmark egy OpenGL-re írt benchmark program, amely minden olyan kártyán fut, amely támogatja az OpenGL 1.2 verzióját és az ARB_multitexturing kiterjesztést legalább két textúrázó egységgel. A tesztben szereplő kártyákon 640*480 felbontáson, alacsony részletességgel futott jól.
Maga a tesztprogram két helyszínen futtat timedemot. Az első egy kültéri terep, egy szigeten cikázik a kamera. A jelenet végén érkezik egy helikopter, amelyből egy tüdővel bőven ellátott hölgy száll ki. A második jelenetben a tüdős hölgy egy földalatti bunker-laboratóriumba vezet el minket. Érdekesség, hogy a bunker bejáratánál kétoldalt egy-egy ágaskodó lovat lehet látni, amik kísértetiesen hasonlítanak a 3DMark 2001 SE végén látható Point Sprites tesztben forgó pacira.

A GeForce 2 kártyáknál semmi különbséget nem mutatott a tesztprogram, de a nagyobb testvéreknél komoly előny mutatkozik az SDR memóriával szerelt Abit kártya javára. Az eltérés 9 FPS, ami 15%-ot jelent arányaiban.

Előfordulhat, hogy ez mérési hiba, de a minimum és maximum FPS értékek is sokkal jobbak az SDR kártyánál, így hitelesnek tekintem a fenti eredményt.

PowerVR tesztek

A két PowerVR tesztprogram a VGA kártyák stencil pufferét és a rejtett felületek eltávolítását teszteli, amely tulajdonságok a PowerVR Kyro és Kyro II kártyák erősségei voltak.

A Templemark alatt az Asus SDR kártya 3,6%-kal gyorsabb a Creative DDR versenyzőjénél, míg az Abit SDR 2,1%-kal gyorsabb az AOpen DDR kártyánál.

A Villagemark tesztben a GeForce 2 MX kártyák között nincs különbség, viszont az MX420 és MX440 között kicsit növekszik is az eltérés, 2,8%-ra hízva.

Játéktesztek

Quake III demó v1.11

A teszt első játékprogramja az OpenGL-t használó Quake III v1.11 demó, amely megjelenésétől nagyon sokáig szerepelt a hardvertesztekben, és kiváló összehasonlítási alap volt 8-10 éve, így a tesztben szereplő kártyákhoz kifejezetten ideális.
A kártyákat 16 és 32 bites színmélységgel, magas minőségi szinten, három felbontáson teszteltem. Timedemo módban futtattam a beépített demo001 demót.

16 bit

Míg a GeForce 2 kártyák különbsége a képernyő felbontásával együtt növekszik, 1,5-től 3,7%-ig, addig a GeForce 4 kártyáknál 16 biten 640*480-ban CPU limit jelentkezik, de nagyobb felbontásban kirajolódik egy másfél százalékos eltérés az Abit SDR javára.

32 bit

A kisebb kártyák viszonya 640-ben és 800-ban zavaros, előfordulhat, hogy mérési hiba történt, de 1024-ben úgymond visszaáll a rend, és közel 5%-kal megelőzi az Asus SDR a Creative DDR-t.
Az NV17 SDR és NV18 DDR esetében rendeződnek a dolgok 32 biten: az előbbi gyorsabb, felbontástól függően 1,3 / 2 / 2,7%-kal.

Unreal Tournament v451

A teszt második, Direct3D játéka a nagysikerű Unreal Tournament, amely a mérföldkőnek számító Unreal játék felturbózott grafikus motorjára épült.

16 bit

Érdekes módon minden kártya felbontásonként közel azonos FPS-t produkált, akármelyik generációról is legyen szó. Nem kifejezetten CPU korlát szaga van a dolognak, valami egyéb limitáló tényező is beleszólt az eredmények alakulásába: a felbontásonként egyforma FPS értékek még jelenthetnének CPU limitet, de a sebesség csökken a felbontás növelésével, ami viszont nem jellemző a CPU korlátra. Azt csak remélni tudom, hogy nem valami szoftveres FPS limitbe szaladtam bele, amit el lehetett volna kerülni.

32 bit

32 bitre kapcsolva a kettes sorozatnál már jobban érzékelhető különbségek láthatók, amik a felbontás növelésével egyre inkább megmutatkoznak: 1,1 - 3,6%-ig növekszik az eltérés.
A négyes MX-eknél nagyon kis mértékű marad gyorsaságbeli különbség, az SDR 1% körüli előnyre tett szert, ami szinte elhanyagolható.

Need For Speed Porsche Unleashed

Utolsó játéktesztként a Need For Speed sorozat sokak által máig az egyik legjobb darabjának tartott Porsche Unleashed (egyes országokban Porsche 2000, nekem is így van meg eredetiben) demója teszi próbára az MX kártyákat.

16 bit

16 bites színmélységnél teljes a káosz: annyira összevissza eredmények jöttek ki, hogy az értékelhetetlen: ennek oka lehet a CPU limit, de akár mérési hiba is. 1024-ben csak a GF4 MX-eknél látszik az "elvárható" eredmény, a kisebb MX-eknél magasabb érték jött ki a DDR verzió javára.

32 bit

A magasabb színfelbontásban 640-ben még zavaros a két kisebbik MX viszonya, a DDR-es minimálisan gyorsabb tud lenni. 800-ra és 1024-re lépve viszont eddig nem látott aránnyal (rendre 12,2 és 9,9%) gyorsabb az Asus SDR kártya.
A nagyobb MX-eknél a két alacsonyabb felbontáson 1 - 1,5%-kal gyorsabb az Abit SDR, de 1024-ben a különbség felugrik közel 10%-ra, amilyet eddig nem láthattunk a játéktesztekben.

Értékelés

Értékelés

Most pedig lássuk, hogy a tesztprogramokban, valamint a játékokban 16 és 32 biten hogyan viszonyulnak egymáshoz a kártyák:

A grafikonok azt mutatják, hogy a 128 bites SDR kártyák az egyes csoportokban hány százalékkal gyorsabbak a 64 bites DDR kártyáknál.

A benchmarkok eredménye mixelt, mivel egybe van vonva a 16 bites és a 32 bites eredmény. Jól látható, hogy a GeForce 2 MX kártyáknál átlagosan 3,6 százalékkal gyorsabb az SDR megoldás. A GeForce 4 MX nagytestvéreknél 2 százalék az átlagos különbség.

A 16 bites játéktesztek esetében azt lehet mondani, hogy a tesztelt játékoknál a tesztelt felbontásokon teljesen mindegy, hogy melyik kártyával próbálkozunk, mindegyik verzión közel azonos sebességet kapunk. Minimális különbség kimérhető főleg 800*600 felett, de nem számottevő. Valószínűleg magasabb felbontásban (1280 és 1600) kijönnek a különbségek, de ki az, aki ezekkel a kártyákkal (akárcsak fénykorukban is) 1024 felett játszott? Én biztosan nem, ezért nem is teszteltem őket magasabb felbontáson.
(640-es felbontásban az MX440 0,4%-kal gyorsabb volt az SDR verziónál, de a grafikonon nem tüntettem fel, mivel nem akartam negatív tartományt is ábrázolni.)

32 biten azonban más a helyzet, van kimutatható eltérés. A GeForce 2 kártyáknál a legalacsonyabb felbontáson még elhanyagolható a különbség, de feljebb lépve 4 - 6% előnye van a 128 bites SDR verziónak.
A GeForce 4 MX kártyáknál csak 1024*768-ban nő meg említésre méltóan a sebességbeli különbség, ami bő 4 százalékot jelent.

A kimutatott különbségek papíron léteznek, de valójában elhanyagolhatók. Ebből az következik, hogy aki annak idején 64 bites DDR GeForce 2 MX-et vett, hátránya legfeljebb az alacsonyabb memória órajel miatt keletkezhetett (lásd a Creative kártya 143 MHz alapfrekvenciáját), nem pedig a szűkebb busz és DDR memória alkalmazása miatt.

Záró gondolatok

Nem véletlen, hogy pont az NV11 és az NV17/NV18 GPU-ra szerelt kártyák szerepelnek ebben az összehasonlító teszben. Ezek voltak azok a belépő szintű GPU-k, amelyekre nagyon sok gyártó többféle variációban készített megoldást (van egy 32 bites DDR GF4 MX kártyám is), és ezekből a többféle memóriakiépítés miatt ki lehetett választani a megfelelő tesztalanyokat.

Az NV17 GPU az NV11 továbbfejlesztése, és a GeForce 4 MX440 sokáig a kedvenc VGA kártyám volt filmnézős gépek építéséhez: mindent tudott, amit kellett. Az NV11 chip 800*600 pixeles TV kimenetét ebben leváltotta a natív 1024*768 méret, ami passzolt a desktopon használt felbontáshoz, így egy sima klónozással meg is volt oldva a TV-re kikerülő kép, méghozzá megfelelő képminőséggel.

Manapság is kerülnek piacra olyan kártyák, amiknek a GPU-ja nagyjából egyforma, de amíg az egyik verzió mondjuk 256 bites GDDR3 memóriával van ellátva, addig a másik 128 bites GDDR5 RAM-ot kapott (pl. ATI Radeon HD 4830 vs ATI Radeon HD 4770). Kíváncsi lennék ezeknél is egy clock-2-clock összehasonlításra, mivel alapból az összehasonlítást az utóbbi nyeri 8-10%-kal, mert bár alacsonyabb valamivel a memória sávszélessége (-11%), de magasabb jóval a GPU órajele (30%).

Leginkább két, elég ritka VGA-t szeretnék összehasonlítani, amiket elég nehéz beszerezni, hacsak nem lehetetlen. Az egyik a DDR2 memóriával szerelt ATI Radeon HD 3850, amihez volt is szerencsém (6000 pont körül teljesített 3DMark 06-ban). A másik a Távol-Keleten forgalmazott ATI Radeon HD 3690 (a.k.a. HD 3830), ami egy 128 bites GDDR3 memóriával ellátott RV670 kártya, azaz felfogható egy butított HD 3850-nek. Ezen a két kártyán véleményem szerint nagyon jól ki lehetne mérni a sebességbeli különbségeket, azaz a 256 bites DDR2 800 MHz memória hogyan viszonyul a 128 bites GDDR3 1600 MHz-es memóriához, ha a GPU ugyanaz. Valószínűleg ez a teszt csak álom marad, mert Európába nem került az utóbbi kártyából.

Azóta történt