Hirdetés

Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Bukmop #48073 üzenetére

    Inkább két kategória van. Amelyik játék eleve CPU-s fizikát használ, annak olyan mindegy, hogy mire van állítva a GPU-s PhysX. Egyszerűen nincsen meg a funkció a programban, hogy kihasználja.

    A GPU-s gyorsítást engedő játékok pedig két nagy részre oszthatók. A régiek régi runtime-ot használnak, ahol a CPU-s PhysX egy szálra és x87-re van korlátozva. Ilyenkor a GPU-s gyorsítás a mesterségesen korlátozott CPU-s feldolgozás miatt előny, már maga a runtime is automatikusan többszálúra rakja a CPU-s feldolgozást. Ez a rigid body miatt fontos, mert az csak CPU-n futhat a régi PhysX-en. Zömében innen van a PhysX előnye, hiszen egy szálra korlátozni a rigid body-t hatalmas hülyeség, és óriási korlátozás. Tehát a GPU-s gyorsítás előnye valójában mindig is a CPU-s kód többszálú feldolgozásának engedélyezéséből jött.
    Az új programok új runtime-ot használnak, ahol a CPU-s PhysX mellett is automatikus a többszálú végrehajtás, és SSE2-re van optimalizálva a rendszer. Ilyenkor egy négymagos proci mellett előnyösebb a PhysX-et a GPU-s gyorsításról levenni, mert a processzor egyrészt hatékonyabban dolgozik, másrészt a GPU sem kapja meg a sebességbüntetés a PhysX miatt, vagyis teljes erejével a grafika számítására koncentrálhat. Persze ebben a Kepler is benne van. A Fermi hatékonyabban dolgozott ezekben a szituációkban. GF100/110 mellett elképzelhető, hogy a GPU-s gyorsítás előnyösebb még ma is.

    (#48080) Attix82: Mondom azért, mert ma a Kepleren a GPU-s gyorsítás inkább lassítás. Ha a tesztelők vették volna a fáradtságot, és a driverben rákényszerítették volna a játékot a CPU-s feldolgozásra a GeForce-on is, akkor a GTX 680 64-65 fps-re képes lenne.
    Maga az architektúra változott meg. A Kepler letért a compute útról, egyrészt rosszabb hatásfokkal dolgozik a PhysX effekteken (talán a legrosszabbul az eddigi architektúrák közül), mint a Fermi, másrészt nagyobb büntetéssel jár a context switch, mert a Kepler SMX modulja sokkal több CUDA mag között osztja meg a regiszterfájlt, mint a GF100/110-es Fermi SM modulja.
    Ugyanezért kerüli a DirectCompute-ot az NV a Kepler mellett, mert ott is nagy bünti a context switch. Főleg a GCN-hez képest, amelyik architektúrát meg csípőből erre tervezték.
    Valószínű, hogy a későbbi driverekben már az automata beállítás nem lesz egyenlő a GPU-s fizikával, mert gondolom az NVIDIA is látja, hogy négymagos proci mellett jobban jár a felhasználó a GPU-s gyorsítás kikapcsolásával. Legalábbis a Keplert használó réteg mindenképpen.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Aktív témák

Hirdetés