Hirdetés

2024. április 30., kedd

Gyorskeresés

Hozzászólások

(#576) ukornel


ukornel
aktív tag

Úgy tűnik, mintha az AMD a grafikus csipek Szent Grálját találta volna meg az Infinity Cache-el.
Számos módon igyekeztek a GPU gyártók megoldást találni a sávszélesség problémára: memóriabusz kímélő tömörítő eljárásokkal (Delta Color Compression technikák), illetve új, nagyobb sávszélességű memóriatípusok fejlesztésével (HBM, GDDR6X).
Ezek több-kevesebb előnyt adtak, de az IC messze a leghatékonyabb fejlesztésnek tűnik.

Ha a sávszélességet összehasonlítom a korábbi GPU generációkéval, megdöbbentő, hogy arányaiban milyen csoffadt sávszélességgel érkezik az RX6000 sorozat.
Az FP32 teljesítmény és a sávszélesség hányadosa hagyományosan azt mutatta, hogy 0,3 bit/FLOP alatt már nagyon "éheznek" a feldolgozók, a szűkös sávszél lefojtja a teljesítményt. Igazán 0,4 bit/FLOP fölött kezdtek élni a kártyák, persze architektúrától függően. Compute feladatokban nyilván inkább 0,5 bit/FLOP fölött volt a célérték.
Az RDNA2 meg vígan elvan 0,2 bit/FLOP körüli számokkal. :Y
(Nyilván ehhez elengedhetetlen volt az RDNA-CDNA szétválasztás; a compute feladatokat nem biztos, hogy ilyen hatékonyan meg lehet tolni a 128MB-os gyorsítótárral.)

(Tulajdonképpen az Ampere relatív sávszélessége is hasonló, de ez betudható a lebegőpontos feldolgozók számának megduplázásának, miközben a többi részegység nem arányosan nőtt - a GPU úgymond "compute-nehéz" lett.)

Nagy kérdés, hogy vajon hogyan skálázódik majd az IC hatékonysága lefelé?
A kisebb felbontásra (pl. FHD) érkező lapkákba elég lesz arányosan kisebb cache méret?
Ha igen, akkor még akár az IGP-k teljesítményében is jöhet egy komolyabb ugrás.

Nem csodálkoznék, ha az Nvidia valamelyik következő generációjában szintén alkalmazna valamilyen hasonló cache megoldást.

[ Szerkesztve ]

Copyright © 2000-2024 PROHARDVER Informatikai Kft.