2019. március 22., péntek

Gyorskeresés

Pascal VS Maxwell

Írta: |

[ ÚJ BEJEGYZÉS ]

Bevezető

Ritkán fordul elő, hogy két GPU-mikroarchitektúra egy az egyben összehasonlítható, még akkor is, ha relatíve közel állnak egymáshoz - az újabb chipekben jellemzően szokott lenni egy olyan hangsúlyos terület vagy trükk, ami miatt egy az egyben nem feleltethetők meg egyetlen korábbi variánsnak sem. AMD oldalon idén szerencsénk volt, az RX 470 pont az R9 380X megfelelője lett, amit a computerbase rögtön meg is vizsgált - az derült ki, hogy az új architektúra játéktól függően 1-15%-kal jobb az előzőnél, és a CB játékmixében az átlag kb. 7%-ra jött ki. nVidia oldalon azonban nem volt ilyen jó lehetőség az összevetésre - a legnagyobb kihagyott "ziccer" a GTX 1070 volt, amit 2048 ALU-val pont jól meg lehetett volna futtatni a GTX 980 ellen, de az 1920-szal pont semmire nem megyünk.

Érdekes módon azonban az 1000-es széria kiteljesedésével az alsóházban felbukkant egy megoldás a fenti problémára - a GTX 1050Ti pont azzal a konfigurációval rendelkezik, mint a GTX 950. Adta magát a lehetőség, hogy a nyári GTX 950-es méréseim órajelein megfuttassam ezt a kártyát is - az eredményeket pedig egy rövid szösszenetben közzétegyem.

Megjegyzés: komoly különbség a két kártya között, hogy az 1050Ti-n 4GB VRAM van, míg a 950-en 2GB. A lenti mérések közül csak két esetben mértem magasabb VRAM-használatot 2GB-nál - a Dying Lightban és a DOOM OpenGL verziójában. Mindkét játék esetén igaz, hogy a 2GB VRAM nem befolyásolja hátrányosan a teljesítményt - a később bemutatásra kerülő GTX 1050 és a GTX 1050Ti eredményei között nincs akkora különbség, hogy erre kelljen gyanakodni.

(Fél)szintetikus tesztek

A Unigine Heaven mérések ugyan csak utalnak rá, hogy mire lehet számítani egy valódi játékban, viszont a különféle beállításokkal nagyon jól ellenőrizhető, mennyire tudják kiszolgálni a kártyák az erős backend-igényt, az erős frontend-igényt, valamint mennyire érzékenyek a pixelszám növekedésére.

Nem véltetlen ragaszkodom ehhez a szintetikus teszthez - van, hogy semmi értelmes nem derül ki belőle, most azonban rendkívül érdekes dolgokra derít fényt. Alapbeállítások használata mellett közel egyenértékű egymással a két architektúra - mind fullHD, mind WQHD felbontásban kicsi a különbség (különösen a minimumok terén, ahol 1920x1080-ban a Maxwell még gyorsabb is), viszont az extra feature-ök kapcsolgatásával elszabadulnak az FPS-ek. Az Ultra beállítás 8-10% előnyt hoz a Pascalnak, a 8xMSAA pedig több, mint 15%-ot, ami arra utal, hogy a Pascal teljesítményelőnyéért elsősorban a delta color compression javítása, azaz a sávszélesség jobb kihasználása felel. Az igazi meglepetés azonban a tesszeláció, ahol a Pascal architektúra 11-14%-kal lassabb. Hát ez meg micsoda?

Mérési hibáról szó sincs - a 960 anno 85 FPS-t futott ebben a tesztben, a gyári órajeles 1050Ti pedig 79-et, tehát itt is látszik a Maxwell előnye. Ezen felül anno a hardware.fr méréseiben is megbújt ez az információ - míg normál esetben a GTX 1080 közel 1.5x annyi háromszöget bír kipréselni magából, mint a GTX 980 (az órajelek arányának kb. megfelelően), bekapcsolt tesszeláció mellett alig 10-20% az előnye, a sokkal magasabb órajel ellenére. Nem biztos, de nagyon gyanús, hogy az nVidia szép csendesen visszavett a Fermi óta bivalyerős tesszelációs teljesítményből, és ezzel is spóroltak némi tranzisztort, ill. W-ot.

Játéktesztek

Nézzük akkor, hogyan alakulnak a valós eredmények, számít-e valahol a (valószínűleg) megnyirbált tesszelátor!

5 játékban 2-6% között mozog a különbség, mindössze két kiugró eredményünk van. A Dying Light eredményeit egyértelműen a jobb VRAM-sávszélesség kihasználás számlájára írom, a GRID Autosport esetében pedig az Advanced Lighting / Global Illumination páros használata lehet az ok, ami miatt a Pascal előnye egy kicsit magasabb, mint a GRID 2-ben. A Heavenben látott tesszellációs borzalmak itt nem bukkannak fel - bár több játék használ valamilyen mértékben tesszelációt, az FPS-eken ez nem hagy komoly nyomot. Átlagosan a Pascal chipes kártya 5.5-6%-kal teljesített jobban - ha tekintetbe vesszük, hogy a tényleges órajelek a játékokban az 1050Ti-n kb. 1%-kal magasabbak voltak, akkor elkönyvelhetjük, hogy jelen játékmixben a Pascal architektúra 5%-nyi gyorsulást hozott a Maxwellhez képest.

Konklúzió

Mint oly sok esetben, most is le lehet vonni azt a következtetést, hogy a nagy mondásokkal óvatosan kell bánni. A Pascal egyes fórumokon egy ócska túlpörgetett Maxwell-másolatnak lett kikiáltva, míg a Polaris az újdonságok egész tárházát vonultatja fel - ehhez képest az első architektúra 5% előrelépést hoz az előző generációhoz képest, a második pedig 7%-ot. Drámainak éppen nem mondható a különbség :)

A másik jó hír, hogy még az ősidőkben összeállított, és azóta elsősorban finomhangolt teljesítménybecslő modellem továbbra is egészen jól működik. A GTX 1080-as tesztek megjelenésekor a Pascal által hozott előrelépést 4-5%-ra becsültem, az RX 480-nal debütáló Polarisét pedig 5-10%-ra - mindkét becslés elég jól betalált.

Összességében elmondható, hogy a Pascal generáció nem hozott világmegváltó újdonságokat az architektúra terén - csiszoltak egy keveset a sávszélesség kihasználásán, és minden bizonnyal szép csöndesen alacsonyabb fokozatra tekerték a tesszelátorokat. Az igazi változás ezúttal alacsonyabb szinten következett be, és így a Pascal generáció tagjai 35-45%-kal magasabb órajeleken tudnak üzemelni, mint a megfelelőjük a Maxwell generációban. Ezt az adu ászt nem lehet rendszeresen kijátszani, de ez alkalommal nagyon bevált - könnyen lehet, hogy a Pascalra épülve fogunk látni még egy finomhangolt generációt, és a Volta csak valamikor 2018-ban teszi tiszteletét - addigra meg ki lehet újra találni érdekes dolgokat az architektúrában is.

  • Nem lehet hozzászólni
Copyright © 2000-2019 PROHARDVER Informatikai Kft.