Hirdetés

2024. május 3., péntek

Gyorskeresés

Hozzászólások

(#5251) Cathulhu válasza S_x96x_S (#5246) üzenetére


Cathulhu
addikt

[link]

Érdemes elolvasni a szerző további cikkeit is. Olyan elemző szavára nem szabad adni, aki nyilván valóan elfogult, mert még ha valós alapokon is nyugszik az érvelése, az csak válogatott tények, hogy alátámasszák az igazát.
Volt pár éve egy hasonló elemző, 2017 óta az AMD halálát jósolta, 15 dolláron, 25ön, 35ön, mindenhol az eladásra biztatott, mert mindenhol túlértékelt volt neki az AMD és az Intel bármikor elsöpörheti. Sajnos a nevére már nem emlékszem, de befektetési tanácsadóként ő emberek pénzével játszott, és rendszeresen vesztett az elfogultságának köszönhetően.
SA megvalógathatná kiket hagy publikálni, a reputációjuk múlik rajta

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#5252) Petykemano válasza Petykemano (#5249) üzenetére


Petykemano
veterán

[link] a videó az Intel alder lake és raptor lake termékeiről szól, de említésre kerül az amd is, hogy milyen lehetőségei vannak.

Szokás azt mondani, "Intel is coming Back, but AMD isn't slowing down either"
De nekem most mégis egy lassulás érzésem van az amdvel kapcsolatban. Persze lehet, hogy megcsalnak az érzékeim. Hisz a zen után se 15 hónappal jött a zen2. Talán épphogy a viszonylag gyors zen2->zen3 váltás volt egyedi.
Na mindenesetre oda akarok kilyukadni, hogy a 2022 végén érkező zen4 szerintem egy nyitott ablak az intelnek, hogy felzárkózzon.

Találgatunk, aztán majd úgyis kiderül..

(#5253) Petykemano


Petykemano
veterán

Egy pár hete jelent meg Executablefix rendere a Raphael nevű processzorról.
Akkor az első ami feltűnt nekem az az volt, hogy kicsit mintha magas lenne, magasabb, mint szokott. Ezt talán kevesen említették. Sokkal nagyobb figyelem övezte a kupak megszokottól eltérő formáját, a "lábait" és a "lábak" között elhelyezkedő kondenzátorokat

Összehasonlításképp itt egy kép egy kupaktalanított chipletes ryzenről:


Akkor nem értettem, hogy ennek mi lehet a jelentősége annak, hogy a lábak között kondenzátorok vannak, vagy hogy látszanak. Nem néztem össze.

milyen magyarázatai lehetnek?
- Megmondom őszintén nem értek hozzá, de azért nem zárom ki. Volt szó arról, hogy AM5-be kerülő Raphael 120W, de lehet akár 170W-os megoldás is. Tehát nem zárható ki, hogy ilyen áramfelvételhez szimplán több kondenzátorra van szükség.
- Nem emlékszem, hogy találkoztam volna olyan infóval, hogy az AM5 fizikai kiterjedése hogyan viszonyul az AM4-hez. Arról viszont volt hír, hogy a chipgyártásban nem csak chiphiány van, hanem substrate hiány is. (Ha jól tudom a subsrate az a zöld felületű sárga lapka, amin a chipek elhelyezkednek és aminek érintkezők vannak az alján) Tehát az sem kizárt, hogy az AMD szimplán csak egy az AM4-nél kisebb AM5-öt ad ki, hogy takarékoskodjon a substrate összetevővel, ne az legyen a szűk keresztmetszet.
Elnézést, közben előkerült: [link]
Ez alapján az AM5 fizikailag ugyanakkora, mint az AM4 40x40-es.
- Felmerült egy olyan gondolat is, hogy azért volt szükség egy picit a szélhez közelebb elhelyezni a kondenzátorokat, mert a kupak alatt kellett a hely egy nagyobb interposernek
[link]

Érdekes elképzelés. Az biztos, hogy az IF relatív sokat fogyaszt és lehetne harapni - főleg a szerver termékek esetén - a fogyasztáson, ha egy energiahatékonyabb módját használnák az adatkommunikációnak.
Persze nyilván ezt az AMD eddig költség okokból nem tette meg eddig.

Találgatunk, aztán majd úgyis kiderül..

(#5254) TRitON válasza TESCO-Zsömle (#5250) üzenetére


TRitON
aktív tag

Természetesen tudom, hogy ez egy torz statisztika, viszont ha őket is bele vesszük, akkor a helyzet csak romlik. Mondandóm lényege az volt, hogy a helyzet legalább ennyire rossz.

Mi az? 3 lába van mégsem tranzisztor? - ??? - Traffipax...

(#5255) Devid_81 válasza Petykemano (#5253) üzenetére


Devid_81
nagyúr

Orom lesz majd pasztazas utan tisztitani a procit, mar alig varom a szivast vele kitakaritank a pasztat a lyukakbol es az smd-k kozul :D

[ Szerkesztve ]

...

(#5256) A.Winston válasza Petykemano (#5253) üzenetére


A.Winston
tag

Nem tudom mennyire lesz szerencses ez pasztazasnal majd? :F

nincs

(#5257) Yutani válasza Devid_81 (#5255) üzenetére


Yutani
nagyúr

Pláne, ha valaki ezüst paszta és mennyiség fetisiszta. :D

#tarcsad

(#5258) Devid_81 válasza Yutani (#5257) üzenetére


Devid_81
nagyúr

Liquid metal powaaa'
Pikkpakk pukk lesz :DDD

...

(#5259) S_x96x_S


S_x96x_S
őstag

(versenytárs/piac)
Az Intel kezd merészeket lépni .. RISC-V ...
az Nvidia az ARM-re.
az AMD ????

-----------------------
"Intel offers $2bn for RISC-V pioneer SiFive says report"
https://www.eenewseurope.com/news/intel-offers-2bn-risc-v-pioneer-sifive-says-report

Mottó: "A verseny jó!"

(#5260) S_x96x_S


S_x96x_S
őstag

Best CPUs for Workstations: June 2021
https://www.anandtech.com/show/11891/best-cpus-for-workstations

"For AMD, Threadripper on Zen 3 (probably likely to be called Threadripper 5000) is expected to be coming this year – some were predicting early June due to the annual Computex trade show, however that has been and gone with no insights. As Zen 3 chiplets are straight drop-ins for Zen 2 chiplets, bring-up should go smoothly. But, those chiplets will initially be served in AMD’s EPYC processors first, because that is where the higher margins are. Demand for Zen 3 Enterprise is high, and with the current semiconductor demand for EPYC compared to the size of the Threadripper market, then next-gen Threadripper might have to wait a little bit longer."

Mottó: "A verseny jó!"

(#5261) awexco válasza Petykemano (#5236) üzenetére


awexco
őstag

Nem találom , de valahol irtad , hogy amd cpu fronton túlon túl visszafogott lett. Alapvetően szerintem ennek oka a sok sok évvel ezelőtti szűkös gyártói szerződések állnak TSMC-vel. De én is ezt látom . De ennek ellent mond masszivan , hogy v-cache az kb annyit tesz hogy proci 2-3x annyi felhasznált sziliciummal . Bár lehet , hogy mivel a hüvej jövőbeni megrendelt kapacitásás is átvették más vizeken eveznek , de szerintem egy -két spec Gamer HEDT editiont leszámitva értelmetlen . Mivel 2 proci vagy 1 ? beszerzése ugyan annyi kb ... csak nem mind 1 mennyit kapnak érte .

I5-6600K + rx5700xt + LG 24GM77

(#5262) Cathulhu válasza awexco (#5261) üzenetére


Cathulhu
addikt

egyreszt tajekozatlan vagyok, mert nem olvastam utana, de a v-cache-t is a TSMC fogja gyartani? Az nem mehet 12 nanon a GF-nel?

masreszt a memoriatombok sokkal konnyebben gyarthato, egyszerubb chipek masreszt joval nagyobb redundanciaval is birnak, szoval sokkal kisebb selejtarannyal kell szamolni.

mondjuk ennek ellenere is csak a felsohazba jonnek majd ilyen procik, gondolom nem veletlen

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#5263) poci76 válasza awexco (#5261) üzenetére


poci76
aktív tag

Nem kell 2-3x annyi chip hozzá. A 64 MB cache, ami egy CPU chipletre kerül, az 36 mm2, ami kevesebb mint a fele a chipletnek, és a CPU+cache együtt is jóval kisebb, mint egy APU. A cache mellé rakott kitöltő "szerkezeti" Si pedig nagyon olcsó, nincs megmunkálva 7 nm-es technológiával, gyakorlatilag korlátlan mennyiségben áll rendelkezésre. Korábban írták, hogy egy ilyen v-cache lapka 7 dollárba kerül. Ahogy jön az 5 nm meg a 3 nm, gondolom a 7 nm ára valamennyivel csökken, így egy egész CPU+cache még ennyivel sem lesz drágább, tehát igazából marketingdöntés, hogy drágábban adják-e egyáltalán a v-cache-es CPU-kat, mint a jelenlegi 5000-es sorozatot, vagy ez lesz az új generáció változatlan áron, és az 5000-ek árát csökkentik.

De a v-cache lehet "végre" egy új eszköz a szegmentálásra. Régen a processzor órajele szerint elég szépen lehetett ugyanazt a chipet különböző árkategóriákban eladni, de ma az van, hogy "ne vegyél 3600x-et, hanem vegyél 3600-at, és húzd fel, ugyanott vagy". Most csak a magok számával lehet játszani, az 5000-es családban kizárólag ez alapján vannak szegmentálva a procik. Viszont, ha a sima procin nem lesz v-cache, az X-en meg lesz, akkor ott szépen lehet szegmentálni.

(#5264) Petykemano válasza awexco (#5261) üzenetére


Petykemano
veterán

Itt volt, hogy az "AMD lelassult" [link]
De ez nyilván csak egy percepció.

A zen4 megjelenése szerintem az 5nm elérhetőségének függvénye.

/// Figyelem, wishful thinking következik ///
//////////////////////////////////////////////////////////////

A magam részéről elégedett lennék az AMD által végrehajtott ütemmel, ha 2021Q4-2020Q1-ben ha az alsóbb szegmensben kapható termékek árai visszamennének. Tehát mondjuk a 6 magos nem $299 lenne, hanem visszamenne $249-re. (Ez mondjuk már majdnem teljesül az 5600G-vel) és ha a nem emelkedő árszínvonal mellett minden szegmenst ellátnák v-cache-sel. Tehát a 6 magos is kapna csak legfeljebb kevesebbet.
(Én erre azért látnék némi esélyt, mert valószínűleg az Alder Lake is minden szegmensben meg fog jelenni)

Találgatunk, aztán majd úgyis kiderül..

(#5265) S_x96x_S


S_x96x_S
őstag

konferencia anyag:

2021 ACM/IEEE 48th Annual International Symposium on Computer Architecture (ISCA)

Pioneering Chiplet Technology and Design for the
AMD EPYC™ and Ryzen™ Processor Families
https://conferences.computer.org/iscapub/pdfs/ISCA2021-4ghucdBnCWYB7ES2Pe4YdT/333300a057/333300a057.pdf

tömény - 14 oldalas PDF.
created: Mon 07 Jun 2021 07:17:46 PM CEST ( PDF metadata)
keywords: Chiplets, Moore's Law, Processors, Industry, AMD, EPYC, Ryzen, Modular, Modularity, MCM

"
...
In response, the industry is now seeing a trend toward revers-
ing direction on the traditional march toward more integration.
Instead, multiple industry and academic groups are advocating
that systems on chips (SoCs) be “disintegrated” into multiple
smaller “chiplets.” This paper details the technology challenges
that motivated AMD to use chiplets, the technical solutions we
developed for our products, and how we expanded the use of
chiplets from individual processors to multiple product families.
"

Mottó: "A verseny jó!"

(#5266) S_x96x_S válasza S_x96x_S (#5265) üzenetére


S_x96x_S
őstag

ISCA 2021 - teljes program. - June 14–19, 2021
https://www.iscaconf.org/isca2021/program/

pl.
"I See Dead μops: Leaking Secrets via Intel/AMD Micro-Op Caches"
Paper

Mottó: "A verseny jó!"

(#5267) S_x96x_S válasza Cathulhu (#5262) üzenetére


S_x96x_S
őstag

> de a v-cache-t is a TSMC fogja gyartani?

igen ; spéci TSMC 7nm -es integráció - TSMC's CoW (Chip-on-Wafer)

Anandtech:"The TSV interface is a direct die-to-die copper interconnect, meaning that AMD is using TSMC’s Chip-on-Wafer technology. " [link]
-->
https://www.tsmc.com/english/dedicatedFoundry/technology/platform_HPC_tech_WLSI


> Az nem mehet 12 nanon a GF-nel?

minden lehetséges, de szerintem nem éri meg.
ráadásul úgy, hogy még az idén meg is jelenjen a közös integráció ..

és extrém bonyolult lenne.
egyben kellene látnia és kezelnie a rendszernek
a TSMC-s 7nm -es belső L3Cache -t a GF12nm-es ráépülő L3Cache-el.
Mégha együtt is tudna müküdni, még a sebességnek is hasonlónak kell lennie. Ráadásul több pontos - függőleges integrációval
és hogy ez müködjön a két cég mérnökeinek nagyon együtt is kellene dolgoznia, gyártási titkokat kellene megosztani, ...
és ha nem müködik, ki a felelős?
Most a TSMC felel érte .. Ha az AMD erösködik, hogy legyen benne a GF is a buliban .. akkor az AMD lesz a felelős .. a TSMC és a GF egymásra mutogat majd ..
sőt szerintem a TSMC akarja a jövőben az I/O Die-t is gyártani N6-on!
"Zen 4 chips are stated to feature two Zen 4 CCD's based on the TSMC N5 process node and a CIOD (I/O die) based on the TSMC N7 process node however the latest reports suggest that the I/O die has been moved to a 6 nm process node." [link]

ráadásul most úgy tünik, hogy a GloFO eléggé
elhanyagolta a fejlesztéseket.
friss hír: Az IBM már perelni akarja.
"WHY IBM IS SUING GLOBALFOUNDRIES OVER CHIP ROADMAP FAILURES"
https://www.nextplatform.com/2021/06/10/why-ibm-is-suing-globalfoundries-over-chip-roadmap-failures/

amúgy a cikkben van egy AMD - GF spekuláció is.

"What we don’t know is if AMD decided to jump over 10 nanometer processes to 7 nanometer processes to get an edge on Intel or if it really had no choice to do so because GlobalFoundries was pulling the plug to focus on its dual-prong 7 nanometer effort. We think AMD was hit by the same 10 nanometer surprise that IBM was, but AMD never said anything about that and put the best spin on it. Much as IBM did with the difficulties that GlobalFoundries apparently had bringing 14 nanometer processes and IBM never said much at all about 10 nanometer issues. AMD, of course, used 14 nanometer processes from GlobalFoundries for its first generation “Naples” Epyc 7001 chips and still uses 14 nanometer processes in the I/O and memory hub at the heart of the Rome and Milan server processor packages. The Rome and Milan cores are etched by TSMC in 7 nanometers, and Infinity Fabric links hook hub and the cores together in a single package."

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#5268) S_x96x_S


S_x96x_S
őstag

Az Intel a HBM-el nyomul [1] - és a Linux integrációt is elkezdte.
de a Consumer szegmensbe nem valószinű, hogy most az első körben lehozzák ( ".. in select Xeon Sapphire Rapids SKUs." )
viszont az AMD-s V-cahe valószínüleg a 6900X -ben benne lehet.

amúgy a "3D V-Cache" vs. "3D HBM" - nem pont ugyanaz a kategória.[2]
Elméletileg a TSMC-nek is van hasonló HBM-es technológiája.
vagyis jövőre akár az Epyc-ek / Threadripperek is kaphatnának HBM-et.
( a V-Cache mellé )

--------------
[1]
Linux Kernel Prepares For Intel Xeon CPUs With On-Package HBM Memory
"The patches do spell out quite clearly, "On package memory is coming (in the future)...A future Xeon processor will include in-package HBM (high bandwidth memory). The in-package HBM memory controller shares the same architecture with the regular DDR memory controller. Add the HBM memory controller devices for EDAC support."

So far all indications are that on-package HBM memory will be found in select Xeon Sapphire Rapids SKUs."

-----------------
[2]
"""
>AMD: 64MB SRAM (1-layer 3D V-Cache)
>Intel: 64GB DRAM (8-layer 3D HBM)
This is only true for one CCD and just one layer of SRAM. If we are talking 8 CCDs and four layers, that’s 2 GB of a very fast L3$ addition. Also: HBM runs over the IMC, while the SRAM is much closer/faster. That’s not apples to apples.
https://twitter.com/i/lists/1228697405509554176
""

Mottó: "A verseny jó!"

(#5269) Petykemano válasza S_x96x_S (#5268) üzenetére


Petykemano
veterán

Én is olvastam olyan véleményt, hogy 256MB V-cache mellett (ez egyébként akár 3-4TB/s sávszélesség is lehet) nem.biztos, hogy szükséges/érdemes még a HBM is, pláne úgy, hogy közben épp érkezik a DDR5 is.
Nem hülyéség, csak megúszható.
Nem tudom, hogy egyébként költség terén ez mekkora tétel lenne. Korábbról úgy tudjuk, hogy az interposer illetve az arra való chip ültetgetés drága mulatság.
Az AMDnek brutális nagy interposerre lenne szüksége jelenleg.

Én ezt csak az Intel féle tile megoldásban látom megvalósíthatónak. De tegyük össze, amit az AMD RDNA3-ról tudunk és a raphaelről.sejtünk:
Szerintem ez úgy tudna megvalósulni, hogy az AMD készít egy olyan lego elemet, ami egy interposerre tett 1-2-3 chiplet + IOD + HBM3. (Ezt akár külön is lehet árulni a desktop piacon. hBM-mel és anélkül, vagy' akár úgy is, hogy a chipletek valamelyike RDNA)
És ilyen legoelemeket rak egymás mellé két sorba úgy, felfűzi őket egy hosszanti irányban elhelyezett Infinity Cache chipletre (ahogy azt az RDNa3 esetén spekulálták)

Ez az újrahasznosíthatóság szempontjából jól.hangzik, de amúgy elég fura, hogy egy HBM valójában közelebb van, mint a kapcsolódásért felelős Infinity cache.

Végülis ha a IOD zsugorodik 6nm-re, akkor eljéozelhető, hogy nem szükséges olyan hatalmas interposer, ha csak a HBM kerül rá, a chipletek nem.

Mindenesetre az intelnek azért ebben van előnye. Ha rápakolnak HBM-et a processzorra, akkor már nyugodtan mondhatják, hogy a DDR slotokba mehet csak optane. Az AMD-től eddig nem láttunk eltérő memóriarendszerek menedzselésére vonatkozó működést.

Találgatunk, aztán majd úgyis kiderül..

(#5270) TESCO-Zsömle válasza S_x96x_S (#5268) üzenetére


TESCO-Zsömle
félisten

Ha jól tudom, a HBM közel sem az a sebesség, mint az S-RAM. Nyilván fordítva meg a kapacitás alakul így.

Mindenesetre érdekes jövőképet fest, hogy a hagyományos L3 és a DDR5 közé így most bekerül még 2 rétegnyi tár. Ember legyen a talpán, aki ezeknek a kezelését megkomponálja...

Vó'tmá' kategória, de én még mindig azt várom, hogy jöjjön egy legalább 200W-os gamer SOC 6c/12t + legalább 16-20CU + 4-8GB HBM. Lehetőleg midnezt 500$ plafonon. És akkor ott van egyben a 300$-os VGA meg a 200$-os proci egyben.

sz: Tisztában vagyok vele, hogy ez legkorábban is csak azután jöhet, ha már a Radeon vonalat is átállították chiplet dizájnra. Addigra remélhetőleg lesz annyira jó a 3D technológia, hogy a procin ülő S-RAM-on kívül megoldható legyen a GPU-n ülő HBM3 is.

Mivel közölték, hogy az AM5 foglalat bem támogatja a 4-csatornás DDR5 kialakítást, így arról letettem, hogy azzal buffolják a memóriasávszélt, amit egy a fentiekben írt erejű GPU követelne.

[ Szerkesztve ]

Sub-Dungeoneer lvl -57

(#5271) Petykemano


Petykemano
veterán

Egy új AMD big.LITTLE patent

Találgatunk, aztán majd úgyis kiderül..

(#5272) carl18 válasza Petykemano (#5271) üzenetére


carl18
addikt

Zen 5? Szép ígéretesnek tünik. :) Intel destroyer. :U

Hiába szúr, itt Ryzen a úr!

(#5273) S_x96x_S válasza Petykemano (#5271) üzenetére


S_x96x_S
őstag

> Egy új AMD big.LITTLE patent

ha jól értem, akkor ezt csak
2 generációval később vezeti be az AMD a mobil processzoroknál
- mint az Intel.

Vagyis ezen a területen (~mobil)
az AMD követő stratégiát alkalmaz ..

Az Intel mellett még az ARM-es kütyük
(~ chromebook, arm-es windows laptop) lesznek veszélyesek, és akkor ott van még az Apple Silicon (M3?)

Szerintem várható, hogy szoftveresen és hardveresen is összeolvad a notebook a tablet és a mobiltelefon ( ~consumer része )
de legalább az, hogy nem lesznek éles határok.

pl. az új Ipad Pro -ban már M1-es proci van - ThunderBolt-al!
egy billentyűvel "elméletileg" tökéletesen tudná helyettesiteni a MacBook Air-t. És talán nem lenne gond a "macOS Big Sur" futtatásánál se.
Persze csak elméletileg. Valahol olvastam valami Apple mérnök nyilatkozatát, hogy jelenleg nincs ilyen terv. ( feltételezem, hogy azért mert akkor 3 kütyü (telefon, tablet, MacBook) helyett elég lenne
csak 1-2 kütyű sokaknál )
Persze a piac ki fogja kényszeriteni :K ..
( valamikor )

Mottó: "A verseny jó!"

(#5274) S_x96x_S válasza carl18 (#5272) üzenetére


S_x96x_S
őstag

> Zen 5? ... Intel destroyer.

(Szerintem): még teljesen nyilt a verseny.
ráadásul az Intel totális ellentámadásba próbál átmenni
a 2023-as Meteor Lake-el
és ez már a "büszkeségről" szól, a pénz kevésbé számit.
legalábbis a vásárolt TSMC 3nm-es kapacitásból erre következtetek.
Az új vezető mindent el fog követni, hogy tudják tartani az ütemtervet.

De az talán kiszámítható, hogy a TSMC-nek se érdeke, hogy az Intel rövidtávú bérlése, kiüsse az egyik legnagyobb - hosszú távú ügyfelét az AMD-t. Vagyis szerintem az AMD-nek is biztosítja majd a 3nm-ers technikát ( feltéve ha az AMD akarja .. )

de amúgy ..
a (tisztességes) verseny jó - mindenkiből a legjobbat hozza ki.
:R

Mottó: "A verseny jó!"

(#5275) Petykemano válasza Petykemano (#5123) üzenetére


Petykemano
veterán

Egy pár hete AdoredTV bedobta, hogy lesz 128 magos zen4/Genoa
Felrobbant az internet, fel is került AdoredTV leak listájába élből "false" státuszban ;)

most:
"Wow, ZEN4 is really more than 96 cores.I was skeptical when I first saw this news in Chiphell. Now I can also confirm that ZEN4 is up to 128 cores."
[link]

Mások szerint lehet, hogy létezik 128 magos zen4, de az továbbra sem Genoa.

Találgatunk, aztán majd úgyis kiderül..

(#5276) S_x96x_S válasza Petykemano (#5275) üzenetére


S_x96x_S
őstag

> lesz 128 magos zen4/Genoa

végre egy pozitiv "mag-inflációs" hír :-)

Szerintem az AMD oldaláról minden lehetséges
tartalékot igyekeznek felhasználni.
És biztos az Intelnek is lesz 1-2 meglepetése
.. amit legalább a magszámmal ellensúlyozni lehet ...

Az AMD ~1 évvel ezelőtt nyilvánosságra hozta az "Infinity Architecture"
tervét [1] .. Ezzel elméletileg a CPU-s chipleteket is skálázni lehet.

[1]
March 5, 2020
AMD Moves From Infinity Fabric to Infinity Architecture: Connecting Everything to Everything + https://www.amd.com/en/technologies/infinity-architecture

persze ezen az ábrán gondolkodtam egy kicsit
szerintem a 3rd gen IA már a PCIe5.0 -re épül
( ~4.5 bandwith növekedés erre utal ; 0.5 -öt a latency csökkenésnek tudom be .. )
Viszont valami ok miatt az AMD - nem PCIe5.0 -nak hivja.
lásd az oszlopok elnevezését.
Gen3->Gen4-> 3rdGen Infinity Architekture

Mottó: "A verseny jó!"

(#5277) Petykemano válasza S_x96x_S (#5276) üzenetére


Petykemano
veterán

> szerintem a 3rd gen IA már a PCIe5.0 -re épül
> ( ~4.5 bandwith növekedés erre utal ; 0.5 -öt a latency csökkenésnek tudom be .. )
> Viszont valami ok miatt az AMD - nem PCIe5.0 -nak hivja.
> lásd az oszlopok elnevezését.
> Gen3->Gen4-> 3rdGen Infinity Architekture

Abu Trento és egyéb AMD titkos kódnevek kapcsán valami olyasmit mondott, hogy lesz olyan változat, amiben az AMD azt mondja, hogy toll a fületekbe, ebben nem lesz PCIe csatoló, hanem mindent Infinity Fabric köt össze.

Szerintem az Infinity Architecture ezt az elképzelést használja.
Ez persze nem jelenti azt, hogy ne lenne PCIe5 is az asztalon. De én azt valószínűsítem, hogy a Frontier szuperszámítógépben nem lesz.

Azt nem tudom megmondani, hogy a "3rd gen IF" milyen viszonyban van a PCIe5-höz és a CXL-hez képest. Mármint azon kívül, hogy értelemszerűen nem kompatibilis. De hogy milyen előnyt jelenthet PCIE5/CXL-hez képest, az előttem nem ismeretes. Azt sem tudom, hogy az IF működik fizikai PCIE4 csatlakozáson keresztül. Talán ennek első szárnybontogatása volna a "Smart Access Memory"?

Találgatunk, aztán majd úgyis kiderül..

(#5278) carl18 válasza S_x96x_S (#5274) üzenetére


carl18
addikt

Igen hát arra én is kíváncsi vagyok mikor lesz a piaci részesedés egyenlő. Steam felmérés szerint 30 %AMD 70% intel, azaz nem olyan gyorsan halad ez az AMD esetében.

A Meteor lake-S már valóban versenyképes lehet, mert 8 nagy és 16 kis mag akkár hogy nézzünk nem elhanyagolható mennyiséget tekintve. :)
Cinebench alatt biztos hogy durva eredményt guritana.

Igen szerintem is ha a TSMC adna is az intelnek bérbe kapacítást nem fogja kiemelt ügyfélként kezelni. Mert nem hosszú távú ez a kapcsolat, az intel is bérgyártani kezd így a TSMC konkurenciája lehet.
Apple/AMD akik hosszú távon is velük maradnak, szóval a TSMC érdeke is hogy nekik legyen elég kapacítás.

Bár a jövőbeli AMD termékekre vissza térve az mondjuk tény mindegy milyen jó terméket dob az AMD a piacra ha nem elérhető vagy csak arany áron akkor nem lesz réteg termék.

Mert a Ryzen 1600/1600AF 85 dollárért volt kiszorva, a Ryzen 3600 is 200 dolcsiról indult és volt ez alatt kis kicsit akcióban.
Azért most akkár hogy nézzünk nem is jött X-mentes Ryzen 5600.
És jelenleg az ár-érték arányt is figyelembe véve sokan vásároltam 10400F-t mert az AMD ára elég szépen elszált az utobbi időben.

Csak itt a kérdés hogy mielőtt lezárja az AMD az AM4-et? Fog-e valami igazán jó ár-érték arányú processzort a piacra dobni?
Ryzen 5 5600 200 dollárért kéne a népnek! :)
Ameddig tart a chiphiány nem érdemes olcsóbb termékekre várni. :F

[ Szerkesztve ]

Hiába szúr, itt Ryzen a úr!

(#5279) HSM válasza carl18 (#5278) üzenetére


HSM
félisten

"A Meteor lake-S már valóban versenyképes lehet, mert 8 nagy és 16 kis mag akkár hogy nézzünk nem elhanyagolható mennyiséget tekintve. "
Bár nem látok a jövőbe, de egy ilyentől én már a mostani 5950X-et sem félteném. :DDD Szvsz csak papíron mutat jól, hogy hűha, 24 mag.... Főleg, ha megmarad az az önszivatás, hogy a kis mag nem tudja az AV512-t, és így a nagyon sem használhatod, amíg nem kapcsolod le a 16 kis magot.

[ Szerkesztve ]

(#5280) carl18 válasza HSM (#5279) üzenetére


carl18
addikt

Hát ezt még a jövő zenéje! Hogy mit tud vagy mit nem tud még azt nem lehet eldőnteni, viszont ha jön a nagy magok IPC emelkedése és a kismagok is tudnak számítani 3 ghz környékén azért nem olyan lehetetlen hogy beérjék a jövőben a több magos 5950X-et! :)

A fő problémára mire jön a meteor lake-S már 2023-at írunk, és addig már piacon a Zen 4 is. (Sőt talán Zen 5 is) :C
Itt azzal a gond hogy a Zen 3 már létező processzor, de az intel fejlesztései nagy ígéretek amikből nem tudni lesz-e valójában valami.
Mert azt bevett szokás intelnél a 30% ipc emelkedés gyakorlatban csak 15% amit még órajel csökkenés is kövez.

Azért a Rocket Lake-S most jött idén év elején és hát egyáltalán nem nevezném konkurenciának. Mert árazást nézve prémium a 11900K de natív teljesítmény /harci erő szinten elégé elmarad egy 5900X/5950X mellet.

[ Szerkesztve ]

Hiába szúr, itt Ryzen a úr!

(#5281) Petykemano válasza carl18 (#5280) üzenetére


Petykemano
veterán

A kis magok előnye az, hogy
- 4 atom mag kb ugyanakkora helyet foglal, mint 1 Cove mag.
- Eközben ez a 4 atom mag kb kétszer akkora teljesítményt ad le multithread felhasználás esetén, mint 1 Cove mag
- miközben nemom kb feleannyit fogyaszt.

Az alder lake szerintem egyértelműen mobil fókusszal érkezik. A 8 kis mag inkább értelmezhető Low-Power célokra, semminthogy érdemi segítséget nyújtson a nagy magok mellett a MT teljesítmény növelésében. Éppen ezért nagy valószínűséggel a kis magokat nem nagyon fogják használni desktop környezetben. Mobilon meg ne számoljál AVX512-t.
Ettől függetlenül biztos lesz átfedés, de nem fog nagy hangsúlyt kapni az, hogy az energiahatékony magok mennyivel megdobják desktop környezetben a MT teljesítményt.

A Raptor lake esetén már inkább beszélhetünk ilyen célról. A 16 magot épp ezért én még keveslem. 32 mag esetén elmondhatánk: ugyanannyi helyet foglal, mint másik Cove mag foglalna, de MT teljesítmény szempontjából 16 Cove magot helyettesít, miközben 8 Cove magánál is kevesebbet fogyaszt.
Ezzel mondjuk már fel tudnák venni a versenyt egy akár 24 magos Ryzennel is (most az IPC különbségektől tekintsünk el), amely esetén a 8 fölötti magok szintén csak a MT teljesítményhez adnak hozzá.

Találgatunk, aztán majd úgyis kiderül..

(#5282) hokuszpk válasza HSM (#5279) üzenetére


hokuszpk
nagyúr

"Főleg, ha megmarad az az önszivatás, hogy a kis mag nem tudja az AV512-t, "

valoszinu kenytelen megmaradni, ABU valami olyasmit mondott, hogy rengeteg tranzisztort visz az AVX512, szoval ha tudná, akkor sanszos, hogy nem lenne kicsi :D

[ Szerkesztve ]

Első AMD-m - a 65-ös - a seregben volt...

(#5283) carl18 válasza Petykemano (#5281) üzenetére


carl18
addikt

Szerintem már a 8 energia takarékos mag is szépen dobni fog a Cinebench eredményen. Ebben biztos lehetsz :)
Cinebench R20 alatt ha csak 2000-3000 pontot dob már jobban fog kinézni a tesztekben hogy az intel mennyit fejlődött.
Az inteles szivárgásokba már az intel igy jósol hogy 1,5-2X teljesítmény többletet hozz az Alder Lake-S.

Viszont 20-30%-al lehet erősebb a Big Golden Cove mag maximum.
Szóval az intel már most is belekalulálja a kis magok teljesítményét.

Azért írtam egy ha nagy magok magukban guritanak 6000-6500 pontot Cinebench R20 alatt netto és erre rámegy egy 2000-3000 pont a kis magókból hála akkor már igen is szép eredmény lesz a 9000 Cinebench R20 az inteltől. És ha még olcsóbb is lesz mint egy R5950X akkor azért tud majd vevőket bevonzani.

( Itt az én kalkuláciom) :D
Nos jelenleg egy 11900K tud R20 alatt 5896 pontot.
15-20%-ot minimum nőni fog a teljesítmény 8 magszám mellet.
Ez 6800-7100 pont csak a nagy magok erejét tekíntve.

Egy Régi i5-3470 1000 pontot tud R20 alatt, szóval ettől nem lesz gyengébb az energia takarékos mag sem.
2000 pontot minimum tudnia kell az energia takarékos magoknak 8 mag mellet.

így nekem az a joslásom hogy 8000-9000 R20 pontot generál a nagy és kis mag együtt. 9000 fölött már szerintem nem tud hozni :)
Meg hát itt az a kérdés ha intelnek is lesz 12900K 8+8 maggal az mennyiért fog menni?
Van rá esély az árakat emelni 700-800 dollára ha valóban jól teljesít.

Hiába szúr, itt Ryzen a úr!

(#5284) S_x96x_S


S_x96x_S
őstag

Az Intel publikálta a DPU terveit .. az AMD szerintem a Xilinx megoldását fogja használni ~DPU-nak ( hasonlóan FPGA alapon)

Intel IPU is an Exotic Answer to the Industry DPU
https://www.servethehome.com/intel-ipu-exotic-answer-to-industry-dpu/

"We do not have Intel’s exact implementation details from today’s IPU disclosure, but we generally put FPGA-based NICs in the “Exotic” category. "

vagyis az AMD+Xilinx is "Exotic" lesz - az FPGA miatt.

Mottó: "A verseny jó!"

(#5285) Petykemano válasza carl18 (#5283) üzenetére


Petykemano
veterán

Egyetértek a számításaiddal. Nekem is kábé ez a várakozásom.

Viszont ez az épphogy 9000 score azt jelenti, hogy talán elérik a 3950X-et és az 5900X-et, de az 5950X-nek nincs mitől tartania - ahogy HSM fogalmazott.

Ezért mondtam, hogy valójában keveslem a kis magok számát. Az alder-lake-ből pont az a 8 mag fog hiányozni, amit a raptor lake hoz, hogy megfoghassa MT-ben a max 16 magos zen3-akat. De az alder lake fókusza valószínűleg inkább mobil volt.

Az Alder Lake-kel kb együtt az AMD-től is várunk egy termékrajtot. A worst case scenario az, hogy lesz pár V-cache-sel ellátott sku és nem is tudjuk, hogy hogy reagál a megnövekedett L3$-re.
A best case scenario pedig az, hogy 6nm-es gyártástechnológián készül valami, ami így pár száz mhz-cel magasabb frekvenciát kap és az FCLK is hasonlóképp növekszik, esetleg az IOD is megújul és még v-cache-t is kap (a top SKU) Tehát nincs kizárva, hogy az AMD már 12000 táján landoljon.

Aztán jön a raptor lake, ami zárja ezt a különbséget, viszont addigra az AMD már megteheti, hogy 24 magos designokat dobjon piacra.

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#5286) HSM válasza carl18 (#5280) üzenetére


HSM
félisten

"árazást nézve prémium a 11900K de natív teljesítmény /harci erő szinten elégé elmarad egy 5900X/5950X mellet"
Ebben az a kellemetlen, hogy a házon belüli elődjétől is elmarad.... (10900K) :DDD
Nem mondom, ettől még nem tartom rossznak, de nem épp ideális.

#5281 Petykemano : "Eközben ez a 4 atom mag kb kétszer akkora teljesítményt ad le multithread felhasználás esetén, mint 1 Cove mag miközben nemom kb feleannyit fogyaszt"
Hát azért... A dupla tempó azonos fogyasztáson van csak meg, ha jól értem az ábrát [link] , és némileg nagyobb is a 4 atom, mint egy Sunny Clove, bár az ábrán nem látszik tökéletesen.

A legnagyobb tervezési öngól pedig asztalon, hogy be van építve a nagy magba a durván tranzisztorevő AVX512, és nem lehet kihasználni, ha mennek a kis magok, erre Anandék is kitértek [link] .

#5282 hokuszpk: Ezért nem látom értelmét egy ilyen CPU-nak asztali felhasználásra, szvsz csak a számok fognak jól mutatni a marketing anyagon. Kb. mint amennyire nyolcmagos volt a jóhírű Bulldozer 10 évvel ezelőtt, csak ne nézd a kisbetűs részt.... :C

#5283 carl18 : Azért itt gyorsan álljunk meg egy szóra, a Cinebench tempó erősen optimális eset többszálú feldolgozás tekintetében, életszagúbb mindennapi használatnál azért nem biztos, hogy minden olyan jól fog skálázódni a többféle erősségű magokon. :N Nekem már a korai Ryzenek 4-magos CCX-es felépítése sem nyerte el maradéktalanul a tetszésem, de itt sokkal több problémát tudok elképzelni.
Egy mobilon/tableten tökéletesen értem, miért jó, ha vannak extrém energiatakarékos magok, a sok háttérfeladatra, bőven megéri az ütemezési kompromisszum, de PC-n.... :F Még notebookon is túlzásnak és felesleges bonyolításnak hat számomra. Sőt, egyenesen úgy fest, mintha ez azért jönne, mert sehogy máshogy nem tudnak villantani valamit, ami legalább távolról hasonlít a nagyobb AM4 processzorokra.

#5285 Petykemano : Egyébként még szép kis tartalékok lehetnek a mostani Zen-ekben is, pl. egy 64MB-os Vcache-es 5950X egy modernizált IOD-el, amivel mondjuk 10-15%-al magasabb FCLK-t és ezáltal memória órajelet lehetne elérni azzal még szépen lehetne hozni ám a konyhára. :K

[ Szerkesztve ]

(#5287) S_x96x_S


S_x96x_S
őstag

ez érdekes[1]
van egy olyan gyanúm, hogy egyes ügyfelek - alaplapgyártók miatt kerülhetett be a Zen4-es support a HWiNFO-ba.
pl. a PCIeGen5 -höz a perifériákat hitelesíteni kell .. vagyis a partnereknek sem árt ha tesztelni tudnak az AMD-re is.

A hirtelen megugrott információ szivárgás is ezt valószínűsíti.

Én akár egy ~"paper launch" szerüséget is elképzelhetőnek tartok .. 2022Q1-ben.

[1]
HWiNFO 7.05 (4490) Changelog:
"Enhanced early support of some Zen4-based systems."

" The changelog lists ‘enhanced early support for some Zen4-based systems’ but it does not explain exactly which systems are to be supported."

https://videocardz.com/newz/hwinfo-lists-enhanced-support-for-zen4-systems-in-upcoming-changes

Mottó: "A verseny jó!"

(#5288) Petykemano


Petykemano
veterán

(Ha jól értem)
Az AMD olyan szabadalmakat jelentetett meg, amely a kis és nagy magok közötti váltást Hardveresen, az OS vagy az App tudta nélkül valósítja meg.
[link]

"TL;DR;
With these patents AMD is solving two things, which is a very ingenious approach
1. big.LITTLE architecture that is virtually indistinguishable to the OS scheduler with thread migration done in HW (in contrast to ARM approach)
Using perf monitor to migrate CPU registers, thread state and execution to big core in HW itself without OS knowledge https://www.freepatentsonline.com/y2021/0173715.html Issue here is that only the big or small core is available at any time not both, but not really an issue on desktop if you already have 16 cores to begin with 2. Big and small cores have different levels of ISA support (i.e the small cores cannot support AVX for example and the big cores can). ( in contrast to Intel ADL approach )
Using illegal opcode exception in small core to seamlessly migrate the thread state and execution to big core without OS knowledge https://www.freepatentsonline.com/10698472.html "

Nekem egy kicsit fura. Olyan, mintha az AMD több big.LITTLE projektet is futtatna egyszerre.
Legutóbbi ábrán inkább úgy tűnt, mintha lenne big cluster + LITTLE cluster és a fabrichoz kapcsolódnak.

Ez a megfogalmazás, hogy a programszál költöztetése úgy történik meg, hogy valójában a kis és nagy mag nem elérhető egyszerre, ez sokkal inkább arra emlékeztet, ami ezt megelőzően "low-feature / high feature core" címszóval jelent meg. De egyébként ez utóbbi tulajdonképpen miben különbözik attól, mintha mondjuk egy mag áramtalanítaná az AVX512 vagy egyéb részeit (regisztereket, cache-t, ALU-kat stb), amit épp nem használ?
Egy ilyen megközelítés a fogyasztáson valószínűleg segít, de a tranzisztorigénye a "kis mag" működésnek nem kisebb.

van ellenérv is:
"This sounds terrible from the OS kernel point of view. The physical CPU suddenly getting faster or slower without OS intervention is exactly what you don't want to do. This already happens with hardware-controlled turbo, but this will make this even more complicated (previously you could figure out performance by comparing clock speed, now you have no idea how the little core stacks against the big core)."



"It seems like you are possibly massively over-estimating the amount of floating point used in a JavaScript execution thread vs. the amount of all integer used in actually displaying the GUI. The amount of work to display the GUI is often huge compared to what is actually running in the GUI. Also, I don’t know if anyone is talking about having a core with absolutely no FP resources. If you have a separate small core with a scalar FP unit or even just a small narrow 128-bit unit, that could be used to handle any floating point instructions. Technically they could emulate any vector instructions with a scalar unit; it would just be slow. You could actually emulate floating point units with integer units, but that would be excruciatingly slow.
[...]
Perhaps we are going excavator style with multiple small cores sharing the vector execution resources. It could have a small scalar FPU that handles everything except actual vectorized instructions such that the big vector units stay powered down. Intel has certainly had power issues with processors supporting AVX512, so it would make sense to handle very light loads with a small unit, even if it takes multiple clocks, instead of taking the time to wake up the big unit."


Ez is érdekes ehhez. De ebből nekem nem igazán jön ki a "zen 5 + Zen4D"

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#5289) Petykemano


Petykemano
veterán

Erről nem is volt szó
Arm A510 - Merged Core Architecture: The Complex

Soha nem gondoltam volna, hogy a bulldozer-féle megközelítés (CMT) még vissza fog köszönni valaha.
Persze ez sem teljesen olyan, mert nem osztoznak a frontenden. A bulldozer olyan, mintha egy 2 szálat kezelni képes SMT-s zen mag az integer erőforrásokat mindenképpen statikusan partícionálva érte volna csak el.
Itt viszont csak az SIMD egységeken osztoznak.

Mindenesetre azért érdekes.

Találgatunk, aztán majd úgyis kiderül..

(#5290) Petykemano


Petykemano
veterán

AM5 @ 2022Q2
Hát ez elég érdekes lenne.
(Nem is sorolom a kérdéseket és lehetőségeket.)

Találgatunk, aztán majd úgyis kiderül..

(#5291) S_x96x_S válasza Petykemano (#5290) üzenetére


S_x96x_S
őstag

> AM5 @ 2022Q2

Talán április?
és akkor ~ 1-2 negyedévvel az Intel után jelenik meg.
Remélem lesz benne rendes Gen5
és rendesen ki lesz tesztelve.

ez van ... :R

De az is lehet, hogy a szervert/threadrippert ennél korábban hozzák ki.
( értsd: ~ kiemelt OEM-ek, Cloud partnerek )

Mottó: "A verseny jó!"

(#5292) S_x96x_S


S_x96x_S
őstag

AMD EPYC 7343 / EPYC 7443 Linux Performance
https://www.phoronix.com/scan.php?page=article&item=epyc-7343-7443&num=1

"In any case, the AMD EPYC 7003 series line-up continues exhibiting very strong performance and will be interesting in time to put the EPYC 7343/7443 against similarly priced 3rd Gen Xeon Scalable processors.

The Linux support for the AMD EPYC 7003 series remains in good standing and has been running well across all modern Linux distributions. The only caveats to mention are the AMD SEV-SNP support for upstream still on its way and the (silly) controversy with the AMD Energy driver.
"

"Lastly is the geometric mean for all of the benchmarks carried out on these different processors. From the 115 tests used, the dual AMD EPYC 7343 configuration came out around 3% faster than a single Xeon Platinum 8380. Not bad at all considering the EPYC 7343 2P configuration should retail for around $3k combined compared to $8k for a Xeon Platinum 8380, but it largely depends upon the particular workload(s) of interest to you for how competitive such a configuration would be and if AVX-512 comes into play, etc."


Mottó: "A verseny jó!"

(#5293) carl18 válasza Petykemano (#5290) üzenetére


carl18
addikt

Engem legjobban az érdekel hogy jön-e még idén év végén egy Zen 3+ Warhol. :D A Raphael érdekes lehet.

Mondjuk az Intel az LGA 1700-al Socket V végett nem lesz kompatiblis a régi hűtésekkel. Ez azért törhet fejlesztés előtt borsot az emberek óra alá.
:Y

Hiába szúr, itt Ryzen a úr!

(#5294) Petykemano válasza S_x96x_S (#5291) üzenetére


Petykemano
veterán

> Talán április?
> és akkor ~ 1-2 negyedévvel az Intel után jelenik meg.
> De az is lehet, hogy a szervert/threadrippert ennél korábban hozzák ki.

Közben rájöttem. A Rembrandt jöhet 2022Q2-ben és ahhoz adhatják ki az AM5 alaplapokat.

Találgatunk, aztán majd úgyis kiderül..

(#5295) Petykemano válasza Petykemano (#5288) üzenetére


Petykemano
veterán

big.LITTLE híradó

Hát tiszta hülyék vagyunk! Csodáljuk itt az ARM SVE2-t, hogy hűűű, meg háá, milyen jó, hogy az utasításhossza független a hardver feldolgozó-hosszától.
De hát ez eddig is létezett az x86-ban is.

Emlékszünk?
"A Jaguar ennek támogatását egy 128 bites FADD és egy szintén 128 bites FMUL egység segítségével oldja meg, vagyis a 256 bites AVX utasításokat két 128 bites részre osztva hajtja végre a rendszer, tehát gyorsnak nem nevezhető, de egy alacsony fogyasztású processzormag esetében ez is jóval több a vártnál. Természetesen a 128-128 bites FADD és FMUL egység a 128 bites SSE utasításokra pozitív hatással lesz, hiszen azokat a Bobcattel ellentétben a Jaguar már nem osztja két részre."
[link]

Tehát a Jaguar képes volt 256bites AVX utasítások végrehajtására, csak 2 órajelciklusra volt hozzá szüksége.
Aztán nem is olyan rég:

"The key highlight improvement for floating point performance is full AVX2 support. AMD has increased the execution unit width from 128-bit to 256-bit, allowing for single-cycle AVX2 calculations, rather than cracking the calculation into two instructions and two cycles. This is enhanced by giving 256-bit loads and stores, so the FMA units can be continuously fed."
[link]

Tehát a Zen is 4db 128 bites FP feldolgozóval rendelkezett, amiket össze tudott vonni 1db 256 bites AVX2 utasítás egy ciklusban történő végrehajtására. Akkoriban még volt is szó arról, hogy ennek annyi előnye van az akkor már 256bit hosszú FPU-val rendelkező skylake-kel szemben, hogy akár két különböző 128bites utasítást is végre tud hajtani 1 órajelciklus alatt.

Tehát valójában biztos megvalósítható lenne az, hogy
a) 4db 256bites fpu feldolgozó helyett 8 db 128 bites legyen és ezeket vonja össze. a zen1 => zen2 váltás esetén azonban 4db 128bites feldolgozó helyett 8db 128bites feldolgozó használata biztosan bonyolultabb és nehezebb lett volna, mint 4db 256 bites feldolgozó arról nem is beszélve, hogy nem is biztos, hogy ki lehetett volna használni. De ez most mindegy is
b) Az AMD valószínűleg most is képes lenne 4db 256bites feldolgozót összevonva egy órajelciklus alatt végrehajtani 512bites AVX-512 utasításokat.
Vagy akár arra is képes lehetne, hogy összevonás nélkül, 2 órajelciklus alatt hajtsa végre.
(Más kérdés, hogy ennek van-e értelme)

Mindenesetre az látszik, hogy akár x86 alapon is megvalósítható lenne az, hogy a kismag csak 2db 128bites FPU-t kap és ennek ellenére feature-kompatibilis marad AVX512 tekintetében az akár 4db 512bit hosszú FPU-val rendelkező nagy maggal. Csak ugyanazt az utasítást lényegesen lassabban képes végrehajtani.

"The current rumored specs for Big.Little appear more or less like this in my opinion:
Small Zen4 cores with 128-bit SIMD and big Zen5 cores with 512-bit SIMD.
Zen4 4-track on 3nm => lower leakage, same frequency capability (smaller FPU requires less current)
Zen5 5-track on 3nm => higher leakage, higher current capability (to feed larger FPU), thus higher frequency support at low/mid SIMD capability.

8 Zen5 cores(Big core CCX), 4 Zen4 cores(Small core CCX) => similar strategy as Apple."
[link]

Találgatunk, aztán majd úgyis kiderül..

(#5296) S_x96x_S válasza Petykemano (#5295) üzenetére


S_x96x_S
őstag

> Csodáljuk itt az ARM SVE2-t, hogy hűűű, meg háá,
> milyen jó, hogy az utasításhossza független
> a hardver feldolgozó-hosszától.
> De hát ez eddig is létezett az x86-ban is.

az én leegyszerűsített megértésem szerint:
szerintem az lehet a probléma az, hogy az AVX-512 - nem csak egyszerűen a szélességről szól
- hanem rengeteg új funckionalitást is belepakoltak - amit a 128 vagy 256 bites feldolgozónak is tudnia kellene,
emiatt nehéz skálázni.

Az ARM-en a hardveres skálázás a fő hangsúly,
ezért a végrehajtó egység hosszát és a funkcionalitást nem katyvaszolják össze.
Ha definiálnak egy új funkcionalitást, akkor azt skálázhatóan teszik.
SVE - 128 to 2048 bits
SVE2 - 128 to 2048 bits

Az X86-os világban a váltás egy evolúciós lépés is .. nem lehet egyszerűen emulálni.
128b (SSE-SSE4.2 & AVX)
256b (AVX & AVX2)
512b (AVX512)

Vagyis az ARM sokkal inkább vector​-width-agnosztikus ..
mig az X86 egyáltalán nem.

A RISC-V vektor utasításai még az ARM-nél is rugalmasabbak,
nem véletlenül, hogy az AI/HPC világban elég nagy jövőt adnak neki ..

Mottó: "A verseny jó!"

(#5297) S_x96x_S


S_x96x_S
őstag

AnandTech: Google Cloud Tau - Milan alapon
Google Announces AMD Milan-based Cloud Instances - Out with SMT
vCPUs?

érdekes a teljesítmény és a teljesítmény/árazás kapcsolata.

mindenesetre az AMD határozottan versenyképes.
az Intelhez képest majdnem 2x ár-teljesítmény

STH cikk: https://www.servethehome.com/google-cloud-tau-instances-featuring-amd-epyc-7003-milan/

Mottó: "A verseny jó!"

(#5298) Z10N


Z10N
veterán

https://videocardz.com/newz/amd-am5-motherboards-to-arrive-in-q2-2022-raptors-lake-z790-series-in-q3-2022

# sshnuke 10.2.2.2 -rootpw="Z10N0101"

(#5299) S_x96x_S


S_x96x_S
őstag

sok érdekes téma Jim Keller-el ..
hosszú .. szánj rá egy kis időt !
An AnandTech Interview with Jim Keller: 'The Laziest Person at Tesla'

pl.
- AMD, Zen, and Project Skybridge
- CPU Instruction Sets: Arm vs x86 vs RISC-V
- Chips Made by AI, and Beyond Silicon

pl

"
IC: So going back to ISA question - many people were asking about what do you think about Arm versus x86? Which one has the legs, which one has the performance? Do you care much, if at all?
JK: I care a little. Here's what happened - so when x86 first came out, it was super simple and clean, right? Then at the time, there were multiple 8-bit architectures: x86, the 6800, the 6502. I programmed probably all of them way back in the day. Then x86, oddly enough, was the open version. They licensed that to seven different companies. Then that gave people opportunity, but Intel surprisingly licensed it. Then they went to 16 bits and 32 bits, and then they added virtual memory, virtualization, security, then 64 bits and more features. So what happens to an architecture as you add stuff, you keep the old stuff so it's compatible.
So when Arm first came out, it was a clean 32-bit computer. Compared to x86, it just looked way simpler and easier to build. Then they added a 16-bit mode and the IT (if then) instruction, which is awful. Then [they added] a weird floating-point vector extension set with overlays in a register file, and then 64-bit, which partly cleaned it up. There was some special stuff for security and booting, and so it has only got more complicated.
Now RISC-V shows up and it's the shiny new cousin, right? Because there's no legacy. It's actually an open instruction set architecture, and people build it in universities where they don’t have time or interest to add too much junk, like some architectures have. So relatively speaking, just because of its pedigree, and age, it's early in the life cycle of complexity. It's a pretty good instruction set, they did a fine job. So if I was just going to say if I want to build a computer really fast today, and I want it to go fast, RISC-V is the easiest one to choose. It’s the simplest one, it has got all the right features, it has got the right top eight instructions that you actually need to optimize for, and it doesn't have too much junk."

Mottó: "A verseny jó!"

(#5300) hokuszpk válasza S_x96x_S (#5299) üzenetére


hokuszpk
nagyúr

ha jolertem az x86 -ot 8 biteskent emlegeti, nekem ez fura a 8008 meg a 8080 az 8 bites volt, a 8086 -os proci kivul - belul 16 bites, a 8088 amit a legtobb PC/XT megkapott, az meg valami 8 bites adatbusszal operalt, talan a 8085 -el labkompatibilis is volt, na az viszont tenyleg 8 bites...

Első AMD-m - a 65-ös - a seregben volt...

Copyright © 2000-2024 PROHARDVER Informatikai Kft.