Hirdetés

2024. május 13., hétfő

Gyorskeresés

Hozzászólások

(#451) Cathulhu válasza Petykemano (#450) üzenetére


Cathulhu
addikt

Dehogynem, threadripper 2 előtt chiller? Pont ilyen kétségbeesett volt, csak sajnos működik.
Bízom benne, hogy az Zen2 ezt a borzalmat is alázza.
Azt meg nem is minősíteném, hogyha a xeonhoz képest 20% mindössze az előrelépés, akkor hogy jött ki az Epychez képest 240... Nagy nehezen találtak valószínűleg egyet AVX512 tesztet, innentől kezdve nem támadható a kijelentés...

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#452) Petykemano válasza Cathulhu (#451) üzenetére


Petykemano
veterán

Ja hogy arra gondolsz, hogy halo product lenne? Papíron létezik, a 1000W-os chillerrel gyönyörűen le is tudják hűteni, kapni nem nagyon lehet majd, ha esetleg valakinek tényleg kéne, de ha mégis, inkább zárt ajtók között átbeszélik a 2S 28 magos megoldásra?

Én arra gondoltam, hogy bűzlik, hogy abból tényleg kézzelfogható, értelmes termék legyen, nem valami marketing-hack. Az nvidia például úgy szokta csinálni.

A linkpack állítólag nagyon AVX512

"The Next Platform that the 48-core Cascade Lake chip will have 21 percent more oomph on Linpack than the top-bin Skylake Xeon SP-8180M Platinum chip with 28 cores running at 2.5 GHz, and if you do some rough math, that puts the clock speed of the Cascade Lake AP at around 1.8 GHz. "

"On the STREAM Triad test, the future Cascade Lake AP MCM will beat the top-bin Skylake Xeon SP SCM by 83 percent, which is pretty good, but will only be 30 percent better than the AMD Epyc 7601."

Ha a az elég "kezdetleges" 7601-hez képest +30%-ot tud csak ebben a tesztben, azt gondolnám, hogy akkor ezt a 7nm-en készülő epyc2 még 48 maggal is megugorná.

Találgatunk, aztán majd úgyis kiderül..

(#453) Cathulhu válasza Petykemano (#452) üzenetére


Cathulhu
addikt

Ez arra jo, hogyha valakit holnap meggyozne mondjuk az Zen2-es Epyc es elgondolkodna a valtason mondvan az intelnek semmije sincs ez ellen, mehessen a marketinges es lebeszelhesse az ingadozot. Aztan az mar kit erdekel, hogy ehhez ugyanugy foglalatvaltas kell mintha epycre allna az ember, vagy hogy ennek a foglalata sem lesz hosszabb eletu mint az SP3.
Arra van barmi esely, hogy AVX512 support jojjon a Zen2-ben? Tudom nagyon retegigeny, de az intel egyetlen megmaradt fegyvere benchmarkokban.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#454) S_x96x_S válasza Petykemano (#450) üzenetére


S_x96x_S
őstag

>Az intel nem szokott ilyen megelőző csapásokat intézni.

Az AnandTech -esek szerint is szokatlan
"Food for thought... at 11pm PT on a Sunday. Kind of an odd time for this announcement."
https://twitter.com/IanCutress/status/1059340497569832960

Az AMD Horizont eventjének nem látom az időpontját. de szerintem késő este / szerda hajnalban lesz valami infó. ( SanFrancisco időzóna )
"AMD's next horizon event is scheduled for Tuesday, November 6, 2018, where we will discuss innovation of AMD products and technology, specifically designed with the datacenter on industry leading 7-nanometer process technology."

Várhatóan az AnandTech -en lesz valami ...
https://twitter.com/IanCutress/status/1059186720497852416

Mottó: "A verseny jó!"

(#455) S_x96x_S válasza Cathulhu (#453) üzenetére


S_x96x_S
őstag

>Arra van barmi esely, hogy AVX512 support jojjon a Zen2-ben? Tudom nagyon retegigeny,
>de az intel egyetlen megmaradt fegyvere benchmarkokban.

szerintem kicsi az esély.
- inkább a sima AVX2 -t kellene megerősíteni.
- Az AVX512 túl sok szilikonhelyet elvesz és melegszik extrém módon.
- az AMD a GPU-val próbálja megoldani az AVX512-es feladatokat.

https://twitter.com/InstLatX64/status/1057607067844911104

meg az AVX512 is finomodik még. nyugodtan lehet várni 1 évet.
https://pbs.twimg.com/media/DXSRqJXXUAE0s4J.jpg:large

Az AMD-nek más a stratégiája - Agner AVX elemzése ( ZEN-ről )
"AMD has a different way of dealing with instruction set extensions than Intel. AMD keeps adding new instructions and remove them again if they fail to gain popularity, while Intel keeps supporting even the most obscure and useless undocumented instructions dating back to the first 8086. AMD introduced the FMA4 and XOP instruction set extensions with Bulldozer, and some not very useful extensions called TBM with Piledriver. Now they are dropping all these again. XOP and TBM are no longer supported in Ryzen. FMA4 is not officially supported on Ryzen, but I found that the FMA4 instructions actually work correctly on Ryzen, even though the CPUID instruction says that FMA4 is not supported."
https://www.agner.org/optimize/blog/read.php?i=838

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#456) Petykemano válasza Cathulhu (#453) üzenetére


Petykemano
veterán

Én nem értek a lovakhoz, de azt olvastam, hogy az AMD-nek avx512 impelemtálása helyett praktikusabb lenne inkább az ilyen hosszú tömbök kezelésére gpu-t bevetni.

Pontosan nem tudom, mi a különbség a vliw, meg simd, meg avx512 között, de Elvileg mindegyiknek az a lényege, hogy minél sűrűbben tömbösített adatokon tudjál végrehajtani utasítás(oka)t.

Én meglepődnék ha az AMD mégis belemenne ebbe.az utcába.

Találgatunk, aztán majd úgyis kiderül..

(#457) Simid


Simid
senior tag

Ha már témánál vagytok.

Orájt gájz, háizit gón?

(#458) Petykemano válasza Simid (#457) üzenetére


Petykemano
veterán

állat, nagyon bírom, hogy mindig így jelentkezik be.

fú. az elég durva, hogy az eredményeket SMT kikapcsolásával publikálták.

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#459) Petykemano válasza S_x96x_S (#455) üzenetére


Petykemano
veterán

Újabb spekuláció az ábrás csávótól

Találgatunk, aztán majd úgyis kiderül..

(#460) Petykemano


Petykemano
veterán

Találgatások

1. ipc improvement is still higher than expected
2. Focus on improving memory delay
3.avx performance enhancement (but it is estimated that it does not support 512)
4.7nm frequency preview (engineering sample frequency has been higher than expected)
5. More refined boost frequency step Progress (pbo and xfr are smarter)
6. It is not clear whether ryzen will put pcie-4.0
7.one more thing......(ray tracing?!?!)

src

Találgatunk, aztán majd úgyis kiderül..

(#461) Petykemano válasza Petykemano (#450) üzenetére


Petykemano
veterán

15:00 CET

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#462) Cathulhu válasza Petykemano (#461) üzenetére


Cathulhu
addikt

[link]

Ugy nez ki lesz live blog

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#463) S_x96x_S válasza Petykemano (#461) üzenetére


S_x96x_S
őstag

mostani infó

Magyar idő szerint este 6óra. ( 18:00 )

AMD Next Horizon Live Blog: Starts 9am PT / 5pm UTC
https://www.anandtech.com/show/13547/amd-next-horizon-live-blog-starts-9am-pt-5pm-utc

Mottó: "A verseny jó!"

(#464) S_x96x_S


S_x96x_S
őstag

AVX-es spekuláció. @InstLatX64 -tól.

"Not an evidence, but interesting: in the pic you can see the 2 gcc optimization
options that the Zen2 patch does not enable in x86-tune.def for znver2,
but are enabled for znver1. This can implicate that Zen2 prefers 256b
instructions. 1/2"

https://twitter.com/InstLatX64/status/1059515399140720640

"The znver2_cost structure (listing mostly the latencies) is copy of znver1.
If this is true, then the 7nm Zen2 is very similar to the older Zen
but with double wide vector units and bigger buffers.
It may mean that without AVX we can't reach the peak flops in Zen2 anymore 2/2"

https://twitter.com/InstLatX64/status/1059515459521929216

Mottó: "A verseny jó!"

(#465) S_x96x_S


S_x96x_S
őstag

valid Live stream :
https://www.youtube.com/watch?v=GwX13bo0RDQ

Mottó: "A verseny jó!"

(#466) S_x96x_S


S_x96x_S
őstag

AWS - EPYC - bejelentés ..

New Lower-Cost, AMD-Powered M5a and R5a EC2 Instances
https://aws.amazon.com/blogs/aws/new-lower-cost-amd-powered-ec2-instances/

Mottó: "A verseny jó!"

(#467) S_x96x_S


S_x96x_S
őstag

- már a ZEN4 -est tervezik.
- Zen2 has a 4x256b FPU -


via

Amúgy:
"
- Momentum is now on AMD
- Zen 4
- Seizing the opportunity
- Perf is holistic - the process technology and design all helps
- Others in the industry will adopt this approach
- Revolutionary new approach
- Optimized IO die improves latency and power
- 7nm CPU chiplets
- 14nm IO die
- Zen 2 Each IP is its optimal technology
- Enabled configurability, increased peak compute
- Zen introduced a multi-chip approach
- AMD will stay focused
- Hardware enhanced spectre mitigations
- Memory Encryption with Increased Flexibility
- Security
- Maintained high throughput modes
- Increased dispatch/retire
- Doubled load/store bandwidth
- FP with to 256-bit
- Larger op-cache
- Re-optimized instruction cache
- Better instruction pre-fetching
- Improved branch predictor
- Half energy per operation
- Doubled core density
- Improved pipeline, DOuble loading point and load store
- Modular Design
- More Security Elements
" ( via AnandTech live blog )

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#468) S_x96x_S


S_x96x_S
őstag

Amúgy érdekes az új koncepció ..

Mottó: "A verseny jó!"

(#469) S_x96x_S


S_x96x_S
őstag

(#470) Cathulhu válasza S_x96x_S (#468) üzenetére


Cathulhu
addikt

Varhato volt az elmult ~fel ev pletykai alapjan. De amugy ha sikerult a latencyn eleget javitani ahhoz, hogy ne legyen tul nagy hatulutoje a levalasztott vezerlonek akkor viszont hatalmasat lehet nyerni azzal, hogy akar egyetlen mag is elerheti mind a 8 csatornat*, gyakorlatilag megszuntetve a NUMAt, ha jol ertelmezem.

*Amig a GMI csak birja szusszal

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#471) S_x96x_S


S_x96x_S
őstag

Hivatalos - up to 64 Core - ZEN2 + PCIE 4.0

Mottó: "A verseny jó!"

(#472) S_x96x_S válasza Cathulhu (#470) üzenetére


S_x96x_S
őstag

> gyakorlatilag megszuntetve a NUMAt, ha jol ertelmezem.

én másképp értelmezem. Inkább az, hogy mindegyik chiplet - demokratikusan fér hozzá az IO-hoz.
nem úgy mint a 32 magos TR-nél, .. amikor voltak "egyenlőbbek" - és szerencsétlenebbek.

Mottó: "A verseny jó!"

(#473) Cathulhu válasza S_x96x_S (#472) üzenetére


Cathulhu
addikt

Nem, mert szoftver szinten mostmar nem kell tudnod melyik kozeli es melyik tavoli memoria (amikor egy CCX 2 csatornaval rendelkezett, akkor a 3 csatornat mar csak egy masik CCX-en keresztul erte el), hanem minden egyforma "messze" lesz. Valamilyen szinten mind messzi lesz, de ha eleget javitottak a latencyn, akkor ez nem lesz nagy hatrany ahhoz kepest amit profitalni lehet belole.

[ Szerkesztve ]

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#474) Cathulhu válasza S_x96x_S (#471) üzenetére


Cathulhu
addikt

Ez 8x8 Zen2 mag (egy Zen2 8 magos lesz)

Szepen osszezsugorodtak igy 7 nanon es IO nelkul
Kivancsi vagyok a Ryzenek is kulon IO vezerlovel jonnek-e majd. Itt azert ketsegeim vannak, nem erne meg, viszont igy meg akkor teljesen kulon kell tervezni asztalira es szerverre.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#475) S_x96x_S válasza Cathulhu (#473) üzenetére


S_x96x_S
őstag

>Nem, mert szoftver szinten mostmar nem kell tudnod melyik kozeli es melyik tavoli memoria

de azt nem árt tudni, hogy melyik chiplet-hez milyen core-ok tartoznak.
Ha az ütemező az összetartozó feladatokat egy chiplet-re optimalizálja, akkor jobb lesz a késleltetés.

Egy chiplet-en belüli kommunikációnál a latency is jobb lehet.

persze ezt már nem numa -nak nevezik. de mi ahivatlos neve ?

lehet, hogy keverem a CCX hopping -al ..

Mottó: "A verseny jó!"

(#476) Valdez


Valdez
őstag

Miért 14nm az io die? Miért nem akkor már 12nm, ha valamiért "nem lehet" 7nm?

(#477) S_x96x_S válasza Cathulhu (#474) üzenetére


S_x96x_S
őstag

>Kivancsi vagyok a Ryzenek is kulon IO vezerlovel jonnek-e majd. Itt azert ketsegeim vannak,
>nem erne meg, viszont igy meg akkor teljesen kulon kell tervezni asztalira es szerverre.

Szerintem 4 csatornás kisebb IO vezérlő lesz - kisebb tudással,
és 2 CCX -el
( vagy 1CCX + GPU)
- ami belefér egy am4 tokba.

legalábbis nekem igy lenne racionális. Kevesebb PCI és IO csatorna.

de igencsak elbizonytalanítottál. nem vagyok benne biztos.

Mottó: "A verseny jó!"

(#478) Petykemano válasza Cathulhu (#474) üzenetére


Petykemano
veterán

Miért nem éri meg ryzenhez ugyanebben a struktúrában, de kisebb IO chippel? Akkor a cpu magokat 7nm-en egyszer kellett csak tervezni, 14nm meg valamivel olcsóbb úgyis.

Találgatunk, aztán majd úgyis kiderül..

(#479) Cathulhu válasza S_x96x_S (#477) üzenetére


Cathulhu
addikt

Szerintem 4 csatorna nem lesz az AM4 miatt, 2 csatornara meg felesleges kulon vezerlo. Szerintem maradnak az 1 CCX-es, max 8 magos kiszerelesnel, akinek tobb kell, vegyen TR3-at. Ha viszont igazam van, akkor az extra kesleltetes a kulonallo vezerlo miatt az kb megbocsajthatatlan asztali procinal, ahol mindenki kb FPS-ben meri az erot.

#478: szervernel ez megbocsajthato, sot mi tobb szerintem kifejezetten elonyos ez a felepites, sima desktopnal csak hatranyt latok benne egyelore.

[ Szerkesztve ]

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#480) S_x96x_S válasza Cathulhu (#479) üzenetére


S_x96x_S
őstag

>Szerintem maradnak az 1 CCX-es, max 8 magos kiszerelesnel, akinek tobb kell, vegyen TR3-at.

ha technikailag megoldható - akkor meg is fogják csinálni a 2 CCX-et ( 16 maggal az AM4-en).
Verseny van.
Az Intel most 8 magnál jár, de lehet, hogy már ők is készülnek egy 10magos asztali procival.
AZ AMD-nek válaszolni kell egy ilyen valószínű lehetőségre.
Sőt az első csapás az AMD-nek kell megépnie.

A késleltetésen és a memóriavezérlőn szerintem sokat javítanak majd. De majd a teszteknél kiderül.

Mottó: "A verseny jó!"

(#481) Fiery válasza S_x96x_S (#480) üzenetére


Fiery
veterán

Selejt miatt siman jobb megoldas lehet eleve 2 CCX-szel indulni, me'g 6 meg 8 magos SKU-nal is.

[ Szerkesztve ]

(#482) Cathulhu


Cathulhu
addikt

Kezdek mar en is megkavarodni. Az tuti, hogy egy chiplet az 8 mag, de hogy az most 1 vagy 2CCX, azt mar nem tudom. Lenyeg, hogy egy die-ra gondoltam 1CCX alatt (ami jelenleg 2CCX, szoval hulyeseget mondtam), szoval ugy gondolom 1 die lesz a ryzenekben, max 8 maggal, sajat IO-val, kozos cache-el a magok kozott.
2 chipletes asztali CPU-nak nem latom ertelmet, mert akkor rogton nincs kozos cache a magok kozott, rogton nem demokratikus a memoria eleres azon a meglevo 2 csatornan, ami legtobb esetben csak ront, szoval hiaba nagyobb a magszam, ha kozben altalanos feladatokban meg romlik a teljesitmeny, a'la threadripper. Most azt merem mondani, ebben a generacioban (de meg a Zen2+-ban is) 8 mag lesz a normal Ryzenek teteje, utana Threadripperek jonnek.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#483) HSM válasza Cathulhu (#474) üzenetére


HSM
félisten

Egy kisebb IO csip simán reális lehet asztalira is. Nagyon okos húzásnak tűnik ezt a kevésbé kritikus, de annál nagyobb méretű I/O részt az olcsóbb, de még mindig bőven jó és elérhető 14nm-es gyártástechnológián hagyni. Oda egy plusz lapkát tervezni sem akkora költség, mint 7nm-re. Aztán mehetnek asztalra is ugyanazok a 7nm csipletek.

[ Szerkesztve ]

(#484) Cathulhu válasza Petykemano (#450) üzenetére


Cathulhu
addikt

Kicsit visszatekintve tegnapra:

"Linpack up to 1.21x versus Intel Xeon Scalable 8180 processor and 3.4x versus AMD EPYC 7601
Stream Triad up to 1.83x versus Intel Scalable 8180 processor and 1.3x versus AMD EPYC 7601"

Na ma az derult ki, hogy az uj Epyc64C128T elmeleti lebegopontos teljesitmenye 4x-esere nott, illetve hogy c-rayben (szinten elvileg erosen lebegopontos) elveri a dual 8180-at. Ha ez igaz, akkor itt kerem buciraveres esete fog fennallni.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#485) TRitON válasza Cathulhu (#482) üzenetére


TRitON
aktív tag

Szerintem AM4-be 2 féle CPU-t fogunk látni:
- 1 CCX chip, saját I/O-val és memóriavezérlővel, 8 maggal, "olcsón", illetve
- 2 CCX + 1 uncore chip (ami nem ugyanaz, mint az EPYC uncore chipje), közös I/O-val és memóriavezérlővel.
Meg lenne az az előnye, hogy akinek tényleg minimális delay-ekre van szüksége, megveszi a 8 magos változatot, aki pedig dolgozni akar rajta, tud venni egy olcsó platformba 16 magos CPU-t.
A nagy kérdés most már csak a fogyasztás...

Mi az? 3 lába van mégsem tranzisztor? - ??? - Traffipax...

(#486) Petykemano válasza TRitON (#485) üzenetére


Petykemano
veterán

Szerintem 1ccx saját ioval Apu formában lesz csak. Ha lesz. Az IF a zeppelin lapkán belül is eredményezett késleltetést. Meglátjuk, milyenek lesznek a számok. Akárhogy is, de több kisebb (akár különböző nodeon készülő ) lapkát legyártani olcsóbb, mint egyben.

Arra leszek kíváncsi, hogy lesz-e 8c + valami közepes gpu kombó. Mobilba nyilván igen.

Találgatunk, aztán majd úgyis kiderül..

(#487) TRitON válasza Petykemano (#486) üzenetére


TRitON
aktív tag

Én úgy értettem, hogy a tegnap bemutatott CCX chiplet-ekben lévő, az EPYC-ben amúgy letiltott DRAM és I/O vezérlő lesz aktív, így nem kell sehova külön chipet tervezni.

Mi az? 3 lába van mégsem tranzisztor? - ??? - Traffipax...

(#488) S_x96x_S válasza TRitON (#487) üzenetére


S_x96x_S
őstag

> Én úgy értettem, hogy a tegnap bemutatott CCX chiplet-ekben lévő,
> az EPYC-ben amúgy letiltott DRAM és I/O vezérlő lesz aktív,

hol olvastad, hogy azokban a CPU chipletekben egyáltalán lesz DRAM és I/O vezérlő - és most le van tiltva?

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#489) HSM válasza TRitON (#487) üzenetére


HSM
félisten

Szerintem elég nagy pazarlás lenne mindegyikbe rakni, és utána letiltani, és mellé tenni egy bazinagy i/o modult....
Ésszerűbbnek tűnik asztalra vagy akár notebookba csinálni egy kisebb, egyszerűbb i/o modult.

(#490) S_x96x_S


S_x96x_S
őstag

a mostani design -nak meg van az az előnye, hogy az i/O és memóriavezérlőket (14nm) szabadon lehet módosítani.
és a 7nm-es CPU chiplet volumenét magasan lehet tartani, ami ott alacsonyabb árat jelent.

A következő éven igy az AMD tudja támogatni a
- DDR4-et
- és a DDR5 -öt is, ami 2019-ben jön.
- és akár még egy régi kompatibilis refresh-t is kiadhat DDR3-ra.

PCIE-vonalon
- PCIE 3.0
- PCIE 4.0
- PCIE 5.0 -át

Ha nem lesznek jelentős sebességbéli hátrányok, akkor ez extrém flexibilitást adhat az AMD-nek.

Ott vannak még az egyéni chipek ( PS5 ? , XBOX ? ) - ott is bevethető ez a design, mivel
főleg a GPU-ban térnek el a koncepciók.

Szóval jönnek a legózható chipletek.

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#491) Petykemano


Petykemano
veterán

"AMD's Mark Papermaster spoke in detail about its new 7nm Zen 2 core and partnership with TMSC, which will be manufacturing it. From the outset, he claims a doubling of core density and halving of power consumption for the same performance, both potentially indicating that we'll see increased core counts in future from its CPUs. He also claimed that Zen 2 will offer a 1.2x performance boost in IPC over current Zen+-based CPUs helped along by using a second generation Infinity Fabric."

Forbes

Ez némi tárgyi tévedéssel együtt, vagyis akár frekvenciaemelkedéssel együtt sem rossz

"Estimated increase in instructions per cycle (IPC) is based on AMD internal testing for “Zen 2” across microbenchmarks, measured at 4.53 IPC for DKERN +RSA compared to prior “Zen 1” generation CPU (measured at 3.5 IPC for DKERN + RSA) using combined floating point and integer benchmarks."

AMD footnotes

Saját maguk ebben az egyetlen (részrehajló) tesztben 30%-ot mértek. Annál biztosan kevesebb! Meg ez Zen2 vs Zen1 és nem Zen+.

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#492) TRitON válasza S_x96x_S (#488) üzenetére


TRitON
aktív tag

Sehol, csak tippelek.

Ha megnézed ezt a képet, látszik, hogy azért sem a DDR vezérlő, sem az I/O (USB, SATA, PCIe) nem visznek el jelentős területet:
- teljes die méret: 213mm2
- DDR vezérlő: 15mm2 (7%)
- PCIe/IFIS SERDES: 15mm2 (7%)
- USB: ~3mm2 (1,5%)
- SCH: max. 7mm2 (3,3%)
Ez így összesen 18,8%, legyen 20%.
Namármost. A 7nm-es technológiára azt írták, hogy dupla sűrűség érhető el a 12/14nm-hez képest, vagyis ha a magok bonyolultsága nem változik jelentősen, akkor egy darab Zen2 mag mérete 2mm2 kellene, hogy legyen 7nm-en (ugye a dupla sűrűség x-y irányban is értendő, tehát ha 14nm-en A volt a szükséges felület mérete, akkor 7nm-en A/4 lesz). Ha ezt felszorozzuk nyolccal és hozzá adjuk a 32MB L3 méretét (8mm2), akkor 24mm2 adódik. Kerekítsünk felfelé: 30mm2, mindenféle sallanggal. Ehhez jön hozzá az IF, amire úgy emlékszem +15-20%-ot számoltak még a Zeppelin megjelenésekor, vagyis az eredmény 36mm2.
Egy CCX chiplet 65mm2 (nem tudom, hol láttam tegnap este, de ennyire emlékszem), tehát ha tényleg tippelnem kellene, akkor azt mondanám: igen, van rajta I/O és DDR vezérlő.

De ezek csak tippek és logikus(nak tűnő) következtetések. Cáfoljatok meg.

Mi az? 3 lába van mégsem tranzisztor? - ??? - Traffipax...

(#493) Petykemano válasza TRitON (#492) üzenetére


Petykemano
veterán

Szerintem a chipletben nincs IO. Az előadásban el is mondták, hogy az IO vezérlők nem skálázódnak jól és nem is annyira igényelnek alacsonyabb csíkszélességet, nem annyira kritikus a sűrűség, mint a CPU magok esetén. Ezért maradtak azok az - olcsón tervezett és olcsón gyártott - 14nm-en.

Egy másik számítás:

"Each 4-core CCX on GF 14nm is 44mm^2 (including L3); the 8MiB L3 block on its own is 16mm^2. Some back of the envelope math puts 2x 4-core CCX's + another 16MiB (for 32MiB total) L3 at around 120mm^2 on GF, so roughly 60mm^2 on TSMC 7nm, with the remaining 18mm^2 or so accounting the doubled FPU and load/store width, the overhead of unifying 8 cores, and whatever I/O is necessary to communicate with the IOX (and also to the 2x transistor density being optimistic).
"

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#494) Cathulhu válasza Petykemano (#493) üzenetére


Cathulhu
addikt

Valoszinuleg a gigantikus (Zen1-hez kepest legalabbis) L3 a kulonallo IO-t probalja kompenzalni.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#495) Petykemano válasza Cathulhu (#494) üzenetére


Petykemano
veterán

Biztosan.
De ha minden jól megy, egy chiplet már 1 CCX osztatlan 32MB-os L3-mal.

Az sok helyütt felvetődött, hogy a közel 500mm2-es IO chip azt tartalmazza-e, ami a 4 zeppelin chip uncore része volt, vagy abban volt nem használt redundancia (pl USB, South bridge), ami felhasználásra került
Ezen a képen sok rész (kék) nincs külön megnevezve, én nem tudom megállapítani, hogy az nem megnevezett uncore rész, vagy csak huzalozás, vagy mi. Szóval a sok helytütt felvetődött kérdés, hogy vajon az IO chip tartalmaz-e L4$-t (és HBCC-t?)

Az előző bejegyzés alapján "8MiB L3 block on its own is 16mm^2." könnyen kiszámítható, hogy mondjuk 256MB L4$ 500mm^2 lenne, ami képtelenség. Ennél kisebbnek, tehát bárminek, amiben nem fér el az összes CCX L3$ tartalma, pl 128MB-nak nem tudom lenne-e értelme.

A dolog elvileg nem értelmetlen, mert a Broadwell is kapott 5-10% előnyt a 128MB eDRAM hatására.

Találgatunk, aztán majd úgyis kiderül..

(#496) S_x96x_S válasza TRitON (#492) üzenetére


S_x96x_S
őstag

>Ha ezt felszorozzuk ....
>De ezek csak tippek és logikus(nak tűnő) következtetések. Cáfoljatok meg.

az új feljavított lebegőpontos rész azért jelentős helyet elfoglal.
Takarékosságból a ZEN1-nél 128bites részekből rakták össze, amit most 256 bitre cseréltek le.

valamint lehetnek benne olyan nem publikus új részek is, amit később publikálnak, aktiválnak.
Például a ZEN1 tudja az FMA4 -et, de hivatalosan nem támogatja.

A mostani bejelentés csak egy előzetes - elködösített - infó volt. Ebből következtetni nehéz.

Mottó: "A verseny jó!"

(#497) Cathulhu válasza Petykemano (#495) üzenetére


Cathulhu
addikt

Ez bennem is felvetődött, hatalmas lett az IO chip, sok minden elfér benne, egy L4 meg kifejezetten hasznos lenne.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#498) S_x96x_S


S_x96x_S
őstag

A PCI4 talán lehetővé teszi az AMD-nek, hogy saját CPU-s gyorsítókártyát csináljon. ( hasonlót mint a XEON PHI )

A GPU melett nem tudom lenne -e rá piaci kereslet.

Mottó: "A verseny jó!"

(#499) Petykemano válasza Cathulhu (#497) üzenetére


Petykemano
veterán

Spekuláció

"I have a theory on the Rome I/O die. AMD is building it at 14nm instead of TSMC 16nm. One reason is GF WSA. There could be another reason. GF 14HP supports eDRAM. Bit cell size 0.0174 sq um. AMD can pack 256 MB of eDRAM L4 cache in roughly <= 120 sq mm"

Találgatunk, aztán majd úgyis kiderül..

(#500) lezso6 válasza Petykemano (#499) üzenetére


lezso6
HÁZIGAZDA
LOGOUT blog

Szerintem szimplán csak olcsóbb a GloFo. Meg ugye ha az AMD nem gyárt semmit a GloFo-nál, akkor utóbbinak kb lőttek.

[ Szerkesztve ]

A RIOS rendkívül felhasználóbarát, csak megválogatja a barátait.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.