2024. április 18., csütörtök

Gyorskeresés

Műszaki elemzés - mekkora előrelépés a Polaris 10?

Írta: |

[ ÚJ BEJEGYZÉS ]

Bevezető, műszaki adatok

2016. június 29-én az AMD jött, látott és győzött - volna, ha szokás szerint nem barmolják el a fogyasztás / hűtés kérdéskört az RX 480-ban. A kártya 200, ill. 240 USD áron még így is nagyon vonzó - remélhetőleg az egyedi hűtésekkel a fenti problémák a sírba kerülnek, és akkor egy minden tekintetben kifogástalan új ár / teljesítménybajnok lesz a piacon. A kártya ezen aspektusa is megérne egy alapos elemzést, mert az összes olyan szempont szerint nagyot domborít, ami csak eszembe jutott - sajnos erre most idő hiányában nem kerül sor.

Mindenképpen érdemes viszont alaposabban belenézni a műszaki adatok és a teljesítmény viszonylatába - egyrészt azért, mert ezzel egyik tesztoldal sem foglalkozik, másrészt azért, mert ennek a későbbi 14nm-es Radeonokra is komoly kihatása lehet.

Nem lehet 100%-osan biztosra venni, de munkahipotézisként tekintsük úgy, hogy az RX 480 a teljes értékű Polaris 10 chipet tartalmazza, tehát egy Tier3a GPU-ról van szó. Ennek az előző generációs megfelelője a Tonga alapú R9 380X - nézzük, hogy fest egymáshoz képest a két chip:

Sok a hasonlóság - az alapvető egységek terén ALU-ból és textúrázóból tartalmaz többet a 480, 12.5%-kal. Ezen felül az órajelek magasabbak - a core 30.5%-kal, a memória pedig 40.4%-kal. A zöld háttérrrel látható kapacitások ennek megfelelően alakulnak - 30% és 47% közötti előnye van az RX 480-nak. Valamint van egy hatalmas ismeretlen - milyen hatása van az architektúrás újításoknak a sebességre? Mivel ezeket csak úgy lehetne izoláltan vizsgálni, ha a funkcionális egységek száma ugyanannyi lenne, ezért az alábbiakban kicsit szétszedem az RX 480 játékokban nyújtott teljesítményét, és indirekten próbálom legalább felbecsülni, mire is jó a gyakorlatban, és a jelenben az a rengeteg újdonság.

A teljesítmények vizsgálata

Három alapvető számot lesz érdemes figyelnünk az egyes játékokban nyújtott sebesség során:
Minimum előny: mivel a 480 minden funkcionális területen azonos vagy több a 380X-nél, az órajel-növekedéssel biztosan gyorsabb lesz nála - a dominánsabb core órajel 30.5%-os emelésével a memória is tartja a lépést, ezért a minimum-előny 30.5%.
Átlagos előny: a zölddel látható kapacitásokat megetettem a kis modellezőmmel, és azt adta ki, hogy a 480 41%-kal lenne gyorsabb a 380X-nél - akkor, ha ugyanazon az architektúrán lenne a két chip.
Max előny: ideális esetben, ha az adott játék totálisan ALU-limitált, akkor a 480 46.8%-kal gyorsabb - persze ismét azonos architektúra mellett, az újítások ezen felül hozhatnak további FPS-eket.

Nézzük akkor az egyes játékokban nyújtott teljesítményt - mindenhol az RX 480 előnyét fogom szerepeltetni az R9 380X-hez képest. A forrásadatok a hardware.fr-ről származnak, köszönet Damien Triolet-nek az alapos és jól dokumentált munkáért!

Az első grafikon demonstrálja, hogy miért fontos az elemzéseknél a megfelelő dokumentáció. Feltettem rá a szimpla gyári kártyával mért eltéréseket (stock - lila), a garantáltan 1266MHz-en futó kártyával mért eltéréseket (über - piros), valamint a többszörös %-számítás bonyodalmai miatt ezek differenciáját (barna):

Látható, hogy az órajel-dobálás miatt az RX 480 a stock mérésekben csaknem 5%-kal lassabb, mint a garantált 1266MHz-es órajellel. Ilymódon az új kártya átlagos előnye 3%-kal alacsonyabb, mint az azonos architektúra mellett elvárt, és két játék is a minimum alatt teljesít - ez elsőre elég horrornak tűnik. Ezért is fontos a hűtési gondok megoldása, mindenesetre architektúra szempontból innentől az über értékekkel foglalkozunk.

A második grafikonra felkerült a három referenciavonal (kék, zöld, narancs), az über mérések (piros), valamint az az arány, amivel a mérés értéke magasabb a minimum előnynél (barna) - ez utóbbi jelentőségéről majd később. A grafikon:

Szerencsére itt már nem látunk a minimális előny alatt teljesítő játékot (ami arra utalna, hogy bizonyos téren nem javult, hanem romlott az új hardver) - továbbra is van viszont 6db, amely alatta van az azonos arch mellett elvárt szintnek, szemben velük pedig 5 olyan, ami a max szintnél is több előnyt mutat. Mivel a minimum szint feletti előny csak az ALU/TEX teljesítmény előnyéből és/vagy az architektúrás újításokból származhat (a kicsivel nagyobb ugrás a sávszélességben itt már majdnem elhanyagolható), azt kell megvizsgálnunk, hogy melyik játék esetében mi lehet a forrása.
Itt jön képbe a barna számsor - ez pontosan azt mutatja, hogy hány % előnyt jelent kombináltan az ALU/TEX (vélhetően igazából az ALU), ill. az arch extrák. Elég nagy a fluktuáció, 2.7% és 16.6% között mozog - viszont az rögtön leszűrhető belőle, hogy a jelen játékaiban a Polaris architektúra sehol nem hoz drámai előrelépést. Ha azt gondolnánk, hogy 10%-kal jobb a Polaris 10, mint a Tonga, az csak akkor lehetséges, ha a 12.5%-kal több ALU egység hatása elhanyagolható.

Elemzés és konklúzió

Ahogy a fentiekből látható, a Polaris 10 műszakilag egyáltalán nem forradalmi előrelépés a Tongához képest, legalábbis ami a rengeteg DirectX 11-es és a jelenleg elérhető minimális számú DirectX 12-es játékot illeti. Az nVidia GP104-éhez hasonlóan a sebességnövekedés nagy része az órajel emeléséből származik, ezen felül megnőtt az ALU-k száma, és az architektúrában is megpiszkáltak ezt-azt. A GP104 esetében a módosítások 18.6% további FPS-t hoztak, a Polaris 10-nél pedig 9.8%-ot - mivel a GP104 ALU-inak száma nagyobb mértékben nőtt, ez még kb. rendben is lenne, viszont ezzel azt feltételezzük, hogy az architektúrás újítások értéke megegyezik, ez pedig a Polaris 10 számos áttervezett egysége tükrében elég nehezen hihető.

Mivel a GTX 1080-nál az látszik, hogy a meglehetősen kevés architektúrás újítás hozott kb. 4-5% előrelépést, azt kell feltételezzük, hogy az RX 480-ban ennél többet jelentenek a fejlesztések - viszont ez a fajta előrelépés az összes 9.8%-nál nem lehet több, tehát valahol 5-10% közé eshet. Ebből következően a 12.5%-kal megnövelt ALU-szám 0-5% előrelépést hozott, ami nagyon kevés, főleg akkor, ha a memória eddig elhanyagolt kb. további 1%-át idevesszük, mert akkor már csak 0-4%-ról beszélünk. Ez azt jelenti, hogy a ALU-k teljesítményének kihasználását valami visszafogja. Tekintettel arra, hogy a setup és a chip infrastruktúrája dimenzióiban megegyezik a jóval nagyobb Fijivel, és a memória majdnem annyi boostot kapott, mint a számítási teljesítmény, ismételten a szerencsétlen ROP-ok felé mutat a vádló ujj. Ez persze nem meglepő - már a 380 és a 380X összevetésénél is látszott, hogy kevés a backend kapacitás, és ugyanezt mutatta kétszer akkorában a Fury és a Fury X közötti differencia is. Az AMD-nek ez már a sokadik chipje, ahol a jobb jövőbeli teljesítmény érdekében a jelenre alulméretezik a backendet - nem nagyon értem, hogy az eddigi bukták, valamint a kivételnek számító Hawaii és Pitcairn sikere miért nem módosítja ezt az irányt, de úgy tűnik, bizonyos dolgok nem változnak. Azt ugyan nem tudom, hogy ha 64 ROP kerül a chipbe, akkor az mennyivel növeli meg a méretet és a tranzisztorok számát, viszont a sebességbeli hatása 20-30% lenne - ezzel az RX 480 kategóriát ugrana.

A tranzisztor-hatékonyság 20%-os növekedése örvendetes, bár a Tonga ezen a téren katasztrófális volt - a Hawaiihoz képest kb. szinten maradt a Polaris 10, és a DX12-re, valamint a VR-re hangolt szunnyadó újítások tekintetében ez elfogadható.
Az energia-hatékonyság 62%-os javulása a csíkszélesség-váltás miatt kb. az elvárható szinten van, hasonló előrelépést mutatott fel a GP104 is - az más kérdés, hogy a beígért 2.8x-os (180%-os) javulástól ez igencsak messze van. Tekintettel a folyamatban lévő fogyasztási ügyre a 480X kapcsán (várhatóan a jobb kihozatal miatt szükségtelenül magas a chipek feszültsége), itt még nem érdemes végleges ítéletet hirdetni.

Végszóként kijelenthető, hogy a Polaris 10 korrekt előrelépést hozott a legtöbb területen, de a "forradalmi" újítások hatása jelenleg nem láthatók. Az RX 480 varázsa az ár / teljesítményben rejlik, és ezért remélhetőleg népszerű is lesz - a DX12- és a VR-tudás demonstrációjára pedig továbbra is várni kell.

Hozzászólások

(#1) Laja333


Laja333
őstag

Köszönjük az elemzést! :R

(#2) TTomax


TTomax
nagyúr

Ilyen cikkekből kellene sokkal több a PH! főoldalra... :R

★★★★★ I got too much soul, rhythm and blues R&B ya see, all that's cool, but hip-hop and rap yeah that's where my heart's at Even back when I used to break on a box ★★★★★ "Chief Rocka"

(#3) #85552128 válasza TTomax (#2) üzenetére


#85552128
törölt tag

+1,

Közérthető. Szép munka! :R

(#4) Z10N


Z10N
veterán

izolálztan ;)

amugy a forradalmi attorest en sem latom (meg)

a culling mukodik a komplex es bottleneckes cuccoknal

a pipeline stall kikuszoboles is majd a nagyon komplex dx12/vulkan-nal jon elo

a primitive discard accelerator majd a bf1-nel mutathat valamit, mert bf4-nel nem hozta az elvartat

Ui: A plusz 15% ipc novekedest se veltem felfedezni.

[ Szerkesztve ]

# sshnuke 10.2.2.2 -rootpw="Z10N0101"

(#5) gbors


gbors
nagyúr

@all: köszi, örülök, hogy tetszett, annak meg pláne, hogy közérthetőre sikerült :)

Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...

(#6) bozont


bozont
veterán

Nagyon jó kis írás. Viszont én sem értem miért nem tanul az AMD és méretezi megint alul a ROP egységeket. Vártam az RX 480-at és szerintem is jól sikerült. De arról nem vagyok meggyőzve, hogy 1440p-re elég lenne a kártya legalább 1-2 évig.
Viszont, ha még idén jönne az RX 485 több CU-val, 64 ROP egységgel és talán magasabb gpu órajellel, azzal már szerintem kiegyeznék. Értelmes áron persze (<150e Ft).

(#7) Z10N válasza bozont (#6) üzenetére


Z10N
veterán

Es mibol fogjak kikohogni, ha mar a 460-t vagdossak visszafele. 1440p-re hiaba irjak, nehol mar keves aki 60fps-re vagyik. 1080p-re tokeletes, illetve nalam lenne eyefinity 3x1080p-re. 150k-ert megtarthatjak :D

# sshnuke 10.2.2.2 -rootpw="Z10N0101"

(#8) tailor74


tailor74
őstag

Korrekt iparos munka ez a teszt, több ilyen kellene. :C

Aminek kerekei, vagy mellei vannak, azzal előbb-utóbb gond lesz.

(#9) solfilo


solfilo
veterán

Köszi az elemzést! :R

solfilo

(#10) 5ent1nel


5ent1nel
aktív tag

Köszönjük az elemzést! :R

További hozzászólások megtekintése...
Copyright © 2000-2024 PROHARDVER Informatikai Kft.