Hirdetés

Új hozzászólás Aktív témák

  • LordX

    veterán

    válasz Fiery #24 üzenetére

    Ez a legnagyobb hülyeség amit tőled valaha olvastam, már bocsánat. Ha direkten szálakat futtatok, akkor nincs szinkronizáció? Annak nincs overheadje, akár kézzel történik (-> extra meló), akár az oprendszer csinálja (túl általános célú -> gyenge perf)? Nem véletlenül van context meg command queue - pontosan erre.

    És hogy írjak direkten ASM utasításokat? Mert a C++ fordító, OpenCL fordító nem ismeri őket, vagy mi? Ilyen alacsony szinten ma már senki nem dolgozik komolyan. Max egykét kritikus ponton optimizál kézzel, de ez pont azt jelenti, hogy nem dobják ki a magas szintű programnyelvet.

    Nem ez a különbség. A hagyományos grafkártya data parallel modellben működik, az Intel MIC meg task parallel. A kettő ég és föld - egyik se jobb a másiknál (azonos elméleti peak teljesítmény mellett, és itt viszont úgy tűnik a GPU-knak áll a zászló), de ha a másik kabátját akarod ráhúzni, akkor eléggé döcögősen fog menni.

Új hozzászólás Aktív témák