Hirdetés

Keresés

Új hozzászólás Aktív témák

  • velizare

    nagyúr

    válasz Jack@l #35272 üzenetére

    te most tényleg azt kérdezted, hogy miért jobb, amikor ugyanazt, vagy hangyányival jobb teljesítményt kapsz kevesebb pénzért? :F
    azt hogy az uarch ehhez mennyivel bonyolultabb, az pont nem érdekel.

    @stratova: a t1/t2 becsapós. az amd már jó ideje x2 kártyákat hoz ki az általad t1-nek nevezett rétegre. tavaly decemberben már feltolták az x2es instinct kártyáikat megnevező patcheket a linux kernelbe.
    > +6860, 04, Radeon Instinct MI25x2
    > +6864, 04, Instinct MI25x2
    > +686C, 04, GLXT (Radeon Instinct MI25x2) MxGPU

  • stratova

    veterán

    válasz Jack@l #35272 üzenetére

    Profi kártyára mehet akár 4 GPU, ami amúgy nem lenne újdonság lásd Tesla M10-et, amihez még TSV sem kellett.

    Nálam most csak picit elgurult a gyógyszer és ha már lego, Titan V-hez mértem (ami gamer piacon nem életszerű) ellenben egy 1080Ti-vel vagy legyen Titan XP.
    Gamer vonalon Tier2-höz még elég lehet egy átgondoltabb monolitikus GPU 4 SE-vel (az NV 4 GPC-jéhez hasonlóan) jobb órajelekkel és fogyasztással.
    Ha AMD-t limitálja a 4SE felépítés akkor Tier1-re legózhatnának. Ehhez alap lehet egy Vega M GH vagy Fenghuang vagy ezeknél magasabb CU számú megoldás. Bár ezzel ráérnek foglalkozni, ha újra emberi árban kell adniuk a gamer VGA-kat :DDD úgy rémlik estek már 10-15%-kal.

    De egy Quadro GV100 most is 7000$ felett megy, vagy 8700$-os Tesla V100-hoz mérve (más órajelekkel) duplázott backenddel 7 nm-en, akár össze is jöhet nekik, ahogy NV-nek is nyilván készül többlapkás terve.
    Jelenleg AMD legdrágább eredetileg 2200$-os WS kártyája (a 7000->4600$-os Radeon Pro SSG-t nem számítva) 1600$, a közelében sincs ez az ár a csúcs Quadrokénak. De a profi vonal még monolitikus Vega 20-szal frissül (noha szvsz a 32 GB-os verziót sem tudják majd GV100 árszinten adni).
    NV-nél a 815mm²-es GPU-val el is érhették, a TSMC gyártási képességeinek határát, így
    elvileg 4 lapkás MCM GPU-ban gondolkodnak.
    Our evaluation shows that the optimized MCM-GPU achieves 22.8% speedup and 5x inter-GPM bandwidth reduction when compared to the basic MCM-GPU architecture. Most importantly, the optimized MCM-GPU design is 45.5% faster than the largest implementable monolithic GPU, and performs within 10% of a hypothetical (and unbuildable) monolithic GPU. Lastly we show that our optimized MCM-GPU is 26.8% faster than an equally equipped Multi-GPU system with the same total number of SMs and DRAM bandwidth.

Új hozzászólás Aktív témák