Hirdetés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz Petykemano #44932 üzenetére

    Najó, hát ha senki, akkor én írok pár gondolatot, ami ha társalgást esetleg nem is generál, de biztosan arra készteti majd a tisztelt olvasóközönséget, hogy kényszeresen helyreigazítson. :D

    Tavaly év vége felé rajtolt el az AMD Mi200 családból a Mi250/X
    Nagyjából ezek a specifikáció, amit az AT ír [link]

    FP64 Vector 47.9 TFLOPS
    FP32 Vector 47.9 TFLOPS
    FP64 Matrix 95.7 TFLOPS
    FP32 Matrix 95.7 TFLOPS
    FP16 Matrix 383 TFLOPS
    INT8 Matrix 383 TOPS

    A ma bejelentett Hopper H100 pedig a következő: [link]

    FP64 (Vector) 30 TFLOPS
    FP64 (Tensor) 60 TFLOPS
    FP32 (Vector) 60 TFLOPS
    TF32 1000 TFLOPS
    BFLOAT16 (Tensor) 1000/2000 TFLOPS
    FP16 (Tensor) 1000/2000 TFLOPS
    FP8 (Tensor) 2000/4000 TFLOPS
    INT8 (Tensor) 2000/4000 TOPS

    Nem vagyok szakértő,a hagyományos FP32 és FP64-et értem. Ebből az látszik, hogy a dupla pontosság esetén az AMD a jobb, de FP32 esetén az Nvidia. Egyébként ha a H100 PCIe és a szintén most bejelentetett Mi210 számait nézzük, akkor érdekes, hogy nagyonis összehasonlíthatók - annak ellenére, hogy az Nvidia termék N4-en, míg az AMD-e csak N6-on készül.

    A többi egzotikus számítási teljesítmény viszont számomra nehezen összehasolítható.
    Vajon az FP32 MAtrix egyenértékű a TF32-vel?
    Vajon az FP16 Matrix és az FP16 Tensor között mi lehet a különbség?
    Arról van-e szó, hogy az Nvidia kártyájában nagyon erős a Tensor, de az csak akkor használható ki, ha egy szoftver direkt a TEnsor magok használatára van programozva?
    Ha csak ezt nézem, az AMD alaposan le van maradva.
    Kijelenthető-e az összes többi értékre nézve is ez, hogy impozánsak az Nvidia számai de feltétel a Tensor magokra való programozás? Ez mennyiben jelent gátat?

    A hagyományos számokban való lépéstartás, és az egzotikus számokban való lemaradás mellett az is érdekes kérdés, hogy vajon mivel készülhet - és mikor - az AMD? Pletykák szerint már nem kell olyan sokat várni a Mi300-ra. [link] [link]
    Mintha olvastam volna valahol egy olyat is, hogy a Mi300 is N6-on készül, tehát az mondjuk egyáltalán nem biztos, hogy a Mi300 az CDNA3-at jelent. Mindenesetre a Mi200-zal csak az EFB mutatkozott be, viszont semmilyen 3D stacking technológia nem. Vajon mit tartogathat az AMD?
    És ugyanez igaz a Hopperre is. Látszólag elég konzervatív megközelítés. monolitikus, semmi 3D stacking.

Új hozzászólás Aktív témák