Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Egon #32351 üzenetére

    Az két külön bekezdés. A második arra vonatkozik, hogy a gyártók nem látják olyan eltérően a lehetőségeket, mert nem csak egy IHV-nek van utasítás-előbetöltést, dinamikus LDS allokációt, vagy szoftveres wave-kontrollt kínáló megoldása. Tehát ezek a kezelések nem specifikusak, hanem általánosak. Reakciók arra a problémára, hogy a shaderek egyre komplexebbek, és a manapság elterjedt übershader modellel a nem a legújabb generációs hardverek dizájnja végeredményben adatra fog várni, ami nem optimális az ALI-kihasználás tekintetében. Ez ellen persze még mindig lehet tenni aszinkron compute-tal, de ebben sem olyan jók a korábbi GPU-k, mint a legújabbak. Ergo minden gyártó azok gondolkodott az új generációnál, hogy miképpen tudnák elérni azt, hogy a komplex übershaderek futtatásakor az adott dizájn tudjon elég wave-et futtatni, vagy az adat hamarabb érkezzen meg, esetleg mindkettő.
    A következő lépcső már az erőforrás-allokáció hardveres menedzselése lesz, mert a trükköket lényegében a Vega és a Volta generációja bevetette, így legközelebb már muszáj nagyban gondolkodni, még úgy is, hogy az komolyan megnöveli a dizájn komplexitását.
    Hosszabb távon még az OOO logika is opció a lane-ekre, mert egyre inkább arra megy a szoftverfejlesztés, hogy az aktuális shader nyelveket felváltja a C++, és ezekbe majd írhatnak kódot a tartalomkészítők is. Ez egyrészt jó, mert jelentősen megoszlik a teher egy stúdión belül, másrészt viszont rossz, mert abból indul ki az egész feltevés, hogy a CPU-k esetében a teljesítményt csak a teljes kód egy kis, mondhatni kritikus része határozza meg, így elég azt optimalizálni. A kódbázis nagy részét lehet szabadon változtatgatni anélkül, hogy az radikális mértékben rontana a programfuttatás sebességén. Egy GPU esetében ez nem így működik, mert itt lényegében minden kód kritikus, vagyis ha a shadereket a jövőben nem optimalizálják tökéletesen, akkor onnantól kezdve a hardvert kell kigyúrni rá. Ez azonban még több éves kérdés, jelenleg az regiszterekre és az LDS-ekre vonatkozó erőforrás-allokáció statikus jellege jelenti a legnagyobb problémát.

  • #52588800

    törölt tag

    válasz Egon #32351 üzenetére

    Teszek én is egy állítást akkor :D

    Hamarabb lesz kevés a VGA, mint ahogy elavul az architektúra :DDD

Új hozzászólás Aktív témák