Az utolsó bekezdés engem is érdekelne.
Mindig eszembe jut, amikor Abu mondta, hogy órajelet akkor érdemes csak órajelet emelni, ha már nem skálázódik az architektúra. Ezt még sztem valahol a gcn1-2 táján mondhatta.
Úgy tűnik, ezt az állapotot az amd valahol ott el is érte a gcn1-2 táján. Jó, persze világos, hogy az ő elképzelésük a compute futószalagok és az async compute köré épültek, mert a gcn alapvetően compute orientált architektúra.
De ehhez úgy kellett volna, kellene programozni a játékokat. De ez nem történik meg. Az ipar compute futószalagra való átállítása zsákutca.
A Hawaii volt az utolsó balanszos lapka, az volt az utolsó állapot, amire az arch még skálázódott. Azóta egy bizonyos szinten túl nem jut. A vegán az látszik, hogy a frontend geometria limites. Lehetne több enginet beépíteni, 4->6, de ezt nem teszik, mert bonyolult, meg nehéz, meg mittomén. A szállított szoftveres megoldás megint nem működik: az ngg programból programozandó és ezt némány techdemón kívül nem fogja megcsinálni senki. Ez itt zsákutca.
Aztán ott van a backend, a ropok, meg ilyenek. Erre Abu azt mondta, lehetne beépíteni többet, csak minek. Mert nem skálázódik. Ez is zsákutca.
A dsbr állítólag működik, mégse lett a Vega sávszéligenye szívószállal kielégíthető. Vagy alig érezni hatását, vagy a frontend a valós limit. Ez is zsákutcának tűnik.
Rapid Packed Math. Fejlesztői közreműködés -> zsákutca
Nem skálázódó árchitektúra es magas falak a szoftveres megoldások előtt. Marad tehát a frekvencia emelése. Itt a fene tudja, hogy az arch limites, vagy a GF 14LPP. Utóbbi nem lenne meglepő, hogy nem rendelkezik azzal az évtizedes tapasztalattal a gpugyártás terén, mint a tsmc.
De hát itt is komoly limitekkel küszködik a polaris és a Vega is.
Tényleg ott tart az amd, hogy látszólag nincs hová lépni, nincs hová mozdulni, nincs skálázódás, nem megoldás az, ha ebből vagy abból többet épít be.
A nagy remény a driver volt. Hogy az ngg majd 4->17 feloldja a geometria limiteket és kivágja az eddig haszontalanul elvégzett munkát. Valamint a dsbr volt.
De ezek az elképzelések bár lehet hogy nem alaptalanok, mivel az implementáció át lett tolva a fejlesztők térfelére, így tudható, hogy annyit fognak érni, mimt a dx12 es az async compute.
Nincs tovább. Fölfelé nem skálázódik tovább.
Lefelé a Vega skálázódhat. De ez is érdekes. A Vega ugye alig jobb, mint a polaris. Ezen a szinten is a wundertreiber tudott volna előrelépést hozni, de nem hozott. Vajon ha a polarishoz képest egy hasonlóan méretezett Vega 20%-kal magasabb frekvenvián megy az el fogja adni?
Jelenleg Vega 40 körüliről nincs szó. De ez nem is baj, hiszen eleve érdekes kérdés, a Vega 64 meddig lenne vágható úgy, hogy nem csökkken a teljesítmény?
Úgyhogy én őszintém nem tudom mivel tudnának előrukkolni nem csak a csúcsteljesítmény növelese, hanem a középkategóriás termékeknél előrelépés terén se.
Találgatunk, aztán majd úgyis kiderül..