Hirdetés

Keresés

Hirdetés

CyberSecurity Connect - blended learning, valódi labor kísérletezésre. Kiberbiztonsági képzés profiktól!
(használd a CYBSEC25PH kuponkódot további 20 ezer ft kedvezményért!)

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz gbors #12969 üzenetére

    Nem láttam olyan teszteket, amelyek nagy különbségeket mutatnak. Az NV szintetikus mérései is csak deferred contextre épülnek, mert IC mellett nem mérnek ki lényeges eltérést. Egyszerűen arra a modellre 12 éve fejlesztenek drivert. Nincs hova továbbfejlődni, mert az elmúlt 12 évben volt idő maximalizálni a teljesítményt az adott driver struktúrára és már az adott architektúrára is (talán a Maxwell még kivétel, de annyira nem különbözik a működése a Keplertől, hogy a mostani rendszer ne legyen elég hatékony).
    Ma a legfőbb eltérés az NV és az AMD modellje között, hogy az NV nagy sűrűn lecseréli az adott játékba rakott shaderek egy részét sajátra. Az exe alapján a driver az eltárolt shadert tölti be a játékba írt helyett és azzal fut. Ebben a koncepció az, hogy az eredeti shadert jobban optimalizálják, miközben az algoritmuson nem változtatnak. Régen a VLIW korszakban az AMD is csinálta, de manapság már ritkán nyúlnak ilyen koncepcióhoz, mert a GCN a legtöbb shader esetében keveset profitál belőle. Az NV-nek ez azért jó, mert viszonylag sokan használnak übershadert, és jellemzően, hogy a regiszterek allokációja túlzóra sikeredik, ami összességében a GPU kihasználtságának csökkenéséhez vezet. Ez a GCN-re azért nem hat igazán, mert egy shader egységre sok regiszter jut (egy GCN shader egység 4 kB-ot kap), míg a Kepler (1,33 kB/shader egység)/Maxwell (2 kB/shader egység) esetében már kevés, a Fermi esetében még jó volt (4 kB/shader egység). Alapvető optimalizálása az NV-nek, hogy a übershaderek allokációját átszervezik, hogy ne foglaljon le a kelleténél több regisztert a shader futtatása.
    Csak, hogy legyen itt minden az Intel is 4 kB/shader egység paramétert használ a Gen7/7.5 architektúrában. Ez az optimális. Ennél kevesebbet a telefonokba/tabletekbe tervezett architektúrák használnak.

Új hozzászólás Aktív témák