Új hozzászólás Aktív témák

  • S_x96x_S

    addikt

    Elméletileg a ZEN3-nak az FPU-ja jelentősen továbbfejlesztett lesz,
    de azért az X86 piacon sötét ló lehet a Centaur új design-ja.
    A wikichip újabb cikket hozott le.
    Ha jól értelmezem a Centaur (8+1) core-ja egy adott task-ban (MLPerf) megfeleltethető 23 cascade lake AP core-nak .. persze ebből nem lehet általánosítani, de ha jól pozicionálják, akkor egy 10% HPC piac talán elérhető vele a jövőben. ( ideális esetben, a következő 2-3 generációval, 7nm-es gyártástechnikán ) ...

    Ami viszont AMD-s nézőpontból érdekes, hogy mely AVX-512-es utasításokat implementálták .. mert itt van egy kis káosz ... az Intel is folyamatosan finomítgat ... nem támogat egyes utasításokat a következő generációban ..
    A 2018-as Intel Palm Cove (10nm) -es AVX-512-es architektúrát választották. Feltételezem, hogy amikor elkezdték a tervezést, akkor ez volt az ismert ...
    A filozófiai kérdés, hogy a következő verzióval mit céloznak meg.
    pl. a Willow Cove - az a legfrissebb 2020-as design, és még mindig van új utasítás ( AVX512_VP2INTERSECT ) és ez is csak a 2 évvel későbbi design-ban jelenhet meg leghamarabb ..
    Legvalószínübb, hogy a Sunny Cove (2019) -es design-ja lehet lemásolva a következő Centaur-ban.

    Én azt is feltételezem, hogy amikor az Intel kijött 2019-ben a Sunny Cove (új AVX512) utasításokkal, akkor az AMD emiatt halasztotta el a saját AVX512-es terveit. Túl nagy változás ... Viszont a háttérben az AMD jelentősen dolgozhat az AVX(2/512)-ön ... mert (akár) ~50% FP ( lebegőpontos) teljesítményt is pletykálnak a ZEN3-nál, és szerintem a kettő összefügg.

    https://fuse.wikichip.org/news/3256/centaur-new-x86-server-processor-packs-an-ai-punch/
    "What stands out is the fast inference latency of the NCORE. For example, on MobileNet using ImageNet, Centaur scored the fastest latency of 330 μs. Likewise, on ResNet-50 v1.5 using ImageNet, Centaur scored about 1 ms. This is half the latency of the Nvidia Xavier Jetson. That’s a sizable advantage considering the NCORE is baked into the CHA SoC whereas alternative NPUs have to be acquired separately and attached as accelerator cards. Intel also submitted a number of results using the Xeon Platinum 9200. Those are very powerful chips but they are also incredibly expensive and power-hungry. Nonetheless, the results show that even with this early silicon, the NCORE can match over 23 of the latest cascade lake AP cores with VNNI which run faster than the NCORE and consume a lot more power."

    A Centaur összefogalót is érdemes átnézni.
    https://en.wikichip.org/wiki/centaur/microarchitectures/cha#CNS_Core_2

Új hozzászólás Aktív témák

Hirdetés