Hirdetés

2024. május 2., csütörtök

Gyorskeresés

Hozzászólások

(#5101) Cathulhu válasza Petykemano (#5075) üzenetére


Cathulhu
addikt

TSMC-s IO lapka elso gondolat: kisebb fogyasztas, nagyobb sebesseg. Ha el lehetne tuntetni a felezest a memoriahoz kepest, az brutalisan dobna szerintem a teljesitmenyen (ott ahol alacsony latency kell es nem high throughput, pl jatekok)

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell

(#5102) S_x96x_S


S_x96x_S
őstag

Lehet, hogy mégis lesz Warhol ( ZEN3+ ) :F
https://twitter.com/KittyYYuko/status/1396241079913959426

GTranslátorral fordítva:
"AMD seems to have resumed the Warhol project, but it's still 7nm on the roadmap. It will be a 6nm process."

@1usmus : " Confirm"

A nagy kérdés, hogy mikor jön a ZEN4 .. mert addig is kell valami.
:R

Mottó: "A verseny jó!"

(#5103) HSM válasza S_x96x_S (#5102) üzenetére


HSM
félisten

Csodálkoztam is, hogy kihagyják, amikor eléggé "low hanging fruit", és még plusz kapacitás is.
A 6nm elvileg a 7nm-es család, csak némileg magasabb tranzisztor sűrűséggel. [link]

(#5104) hokuszpk válasza S_x96x_S (#5102) üzenetére


hokuszpk
nagyúr

annyi biztos, hogy Zen3+ mag letezik, mert a friss roadmapon is van olyan cpu, amire az van elorejelezve. Akkormeg miert ne lehetne asztali belole ?

Első AMD-m - a 65-ös - a seregben volt...

(#5105) poci76 válasza S_x96x_S (#5102) üzenetére


poci76
aktív tag

A SONY bejelentése, hogy átteszik 6 nm-re a PS-t, jó magyarázat arra, ha nincs Warhol: viszik a gyártókapacitást. Ettől persze még jó lenne, ha lenne.

[ Szerkesztve ]

(#5106) Petykemano


Petykemano
veterán

"Strix point adopts the hybrid architecture of zen5+zen4 and introduces a new cache. The desktop version does not know if this mode will be adopted, but it is certain that the same 3nm will be used."
[link]

Ugye nyilván meg lehetne toldani, zen2 és zen3 lapkák összetokozását is - hasonló korlátozások mellett, ami a Lakefield-et is érinti. Értelme nem lenne, mert ugyanazon koncepció és ugyanazon gyártástechnológia mentén készülnek.

Kifejezetten izgalmas lenne egy olyan tick-tock mód elindulása, amely esetén minden második új verzió gyártástechnológiai váltást, alacsonyabb fogyasztást, több cache-t, nagyobb IPC-t, stb eredményezne, de nem hozna új tudást és így korlátozások nélkül összetokozható lenne az előző verzióval. Mondjuk képzeljük el azt, hogy készülhetne egy 5nm-es cache-sel jobban kitömött zen3 tudású lapka, ami ezáltal hoz 15-20% IPC növekedést és összetokozható 1-2 7nm-es zen3 lapkával.

Persze tudjuk, hogy a zen4 nem ilyen.
Azt is tudni véljük, hogy az AMD big.LITTLE koncepciója nem különálló magok fejlesztéséről, hanem magon belüli elkülönülésről szólt.

Az Intel viszont egyértelműen a különálló magok irányába indult, ahol a nagy magok célja az egyszálas teljesítmény, a kis magoké pedig vagy a sokszálas, vagy az alacsony energiaigényű feladatok vitele. A kétféle mag tudásának összehangolása még feladat, de a koncepció szerintem érthető.

Ha a zen5 nem a zen4 utódja, hanem inkább csak annak kitömött nagytesója, vagy egy bifurkációs pont, ahol elválik egy kis és nagy mag vonal, miért hívná azt továbbra is zen-nek?

Találgatunk, aztán majd úgyis kiderül..

(#5107) Petykemano


Petykemano
veterán

Milan-X
az új kódneve annak, amiről már egy éve is szóltak a hírek ( [link], [link] és abu negyedévente
ír róla: [link] , [link] )
Szóval de most már tényleg!

Azt eddig is tudni véltük, hogy a Frontierbe ez mehet. Ugyanez korábban Trento néven futhatott.

Raphael
"- AM5 socket
- DDR5 (no DDR4)
- 28 PCIe 4.0 lanes (+4 compared to Zen 3)
- 120W TDP (170W possible as well )"

Úgy tűnik az AMD megy az intel után a TDP emelésével kapcsolatban. Nehéz volna hibáztatni

Találgatunk, aztán majd úgyis kiderül..

(#5108) Petykemano


Petykemano
veterán

/konkurencia/

A510, A710, X2
35% vs A55
10% vs A78
16% vs X1

Eltekintve az évek óta meg nem újított kismagtól, ez a 10-16% perf uplift azért már nem annyira impozáns, mint a korábbi generációnkénti 20-30% volt.

Találgatunk, aztán majd úgyis kiderül..

(#5109) Devid_81 válasza Petykemano (#5107) üzenetére


Devid_81
nagyúr

Ugy latom csak valami special cucc kaphatja meg majd a 170W TDP-t.
Remelem nem igy kepzelik el a jovot az AMD-nel (is) hogy csakis elengedett fogyasztassal lehet valami gyorsabb :U

...

(#5110) S_x96x_S válasza Petykemano (#5108) üzenetére


S_x96x_S
őstag

> /konkurencia/ ... ARM ...

ki tudja ... ;) soha ne mond, hogy soha ... :)
Szerintem kezdi felkészíteni a piacot .. az AMD-s ARM-es procikra.
Főleg, hogy a Xilinx miatt - az ARM úgyis aktuális lesz.

"AMD Interested In Entering Telecommunications Sector As CEO Doesn't Rule Out Arm-based Products For Enterprise Use"
https://wccftech.com/amd-ceo-optimistic-for-arm-based-products-tight-supply-chains-5g-market/

LisaSu:

". . .So I actually think it's less about ARM versus x86 and more about do you have the right compute at the right performance point, the right price point, with the right features and functions. And so that's how we see this market evolving. So there's definitely a place for ARM in the data center. I think we have deep relationships with all of the data center customers, and we're talking to them about what do they need over the next 5 years. You'll see AMD add more points to our compute road map as well to optimize for some of these different workloads. And I think the value is really in how you put things together.
And so from an AMD standpoint, we consider ourselves sort of the high-performance computing solution working with our customers. And that is certainly the way we look at this. And if it means ARM for certain customers, we would certainly consider something in that realm as well. But we look at it as really, let's talk about what problem you're trying to solve. And then we'll work with you with the best components to address the customers' needs. So that's how we think about our differentiation, and it is an exciting place in compute. So there's a lot of people who are active in the space because there's just so much need for different optimization points."

Mottó: "A verseny jó!"

(#5111) Petykemano válasza S_x96x_S (#5110) üzenetére


Petykemano
veterán

Én ebből csak azt olvasom ki, hogy nek zárkóznak el az arm elől. (Semi custom?) Még akár azt is,.hogy xilinx területre nem próbálnák beerőltetni az x86-ot, csak mert ők most abban érzik.nyeregben magukat, ha egyébként annak ott nincs se hagyománya, se igénye.

De azt nem látom, hogy ez már egy komplett armos átállásra való felkészítés lenne. Mármint ez megtörténhet, de azt nem látom.ebből, hogy ennek az AMD úttörője lenne. Viszont ha úgy alakulnak az ügyféligények, akkor kiszolgálják.

5-10 éves távlatban szerintem az lehet meghatározó, hogy mennyivel.egyszerűbb armra programozni. Ebben számíthat az is, hogy önmagában arm, vs önmagában x86, és az is, hogy ugyanezek heterogén computinggal.
Ez viszont lehet, hogy már oneAPI vs CUDA vs ROCm terület.

Találgatunk, aztán majd úgyis kiderül..

(#5112) S_x96x_S válasza Petykemano (#5111) üzenetére


S_x96x_S
őstag

> Viszont ha úgy alakulnak az ügyféligények, akkor kiszolgálják.

szerintem:

1.)
Cloud -ban már most is valós ügyféligény lehet a heterogén - át-konfigurálható - architektúra.
Vagyis bootoláskor eldönti a gép, hogy most X86 vagy ARM ISA legyen.

az új X3D technológiával - tudnak egy réteg X86 és egy réteg ARM -ot csinálni, de mindig csak az egyik lenne aktív.
Lehet, hogy 20%-al többe kerül a proci, de jobb lesz a gépek kihasználása ( Memoria, ház, disk, .. )
és jobban le tudják követni az igényeket. :K

2.)
Ott van az nVidia ARM-es Cloud -os terve .. hogy az ARM Szerver piacra betör - a saját gyorsítóival.
És az AMD-nek el kell happolnia az nVidia elől a piacot! ;]
és erre szerintem a dual-X86-ARM proci lehet az ideális - csodafegyver.

3.)
De az is lehet, hogy az Intel lépi meg elősször :O .. ( az nVidai miatt .. )
és az AMD kénytelen lesz követni ..

Vagyis szerintem a piaci nyomás miatt - lesz duál-X86-ARM proci!
racionális, kivitelezhető .. és szerintem már dolgoznak rajta.

Mottó: "A verseny jó!"

(#5113) hokuszpk válasza S_x96x_S (#5112) üzenetére


hokuszpk
nagyúr

mostmar komolyan elmegyek josnak :D

*** 14, 39, 43, 57, 81

[ Szerkesztve ]

Első AMD-m - a 65-ös - a seregben volt...

(#5114) S_x96x_S válasza hokuszpk (#5113) üzenetére


S_x96x_S
őstag

Megelőztek, ... nincs új a nap alatt :K

"an ambidextrous heterogeneous compute strategy"

2014:
"To discuss why AMD might build a single chip with both ARM and x86 cores, we first need to cover the industry’s previous attempts at multi-ISA products. (Yes, chip makers have tried this before.)"

"For AMD, neither of these approaches is ideal, and while the company could theoretically implement an x86 cluster and an ARM cluster on the same die (switching between them at boot), that’s another mediocre solution that sacrifices die space for compatibility but risks two mediocre CPU clusters ending up side by side rather than one amazing product. In its discussions, AMD is clear that it’s targeting something unique, something that would leverage its IP and particular strengths — so let’s take a look at two options for what that might be."
...
"A dual x86/ARM SoC could accomplish that if AMD can build a sufficiently elegant architecture. It’s not as crazy an idea as it sounds at first glance — much of the research going on in computing today is focused on improving performance by spinning workloads off to the right core at the right time. Ideally, an initiative like this would establish AMD as the go-to community with comprehensive ISA support that could unify the fractured computing ecosystem.

We won’t know if a chip like this is in the cards for quite some time, but given the direction AMD is headed and its previous public comments, we’d be stunned if it wasn’t. The company has poured too much effort into redefining itself as the heterogeneous compute leader of the future to balk at the idea of a truly heterogeneous ARM-x86 SoC."


forrás:
AMD’s next big gamble: ARM and x86 cores working side by side on the same chip ( 2014 ! )
:R

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#5115) hokuszpk válasza S_x96x_S (#5114) üzenetére


hokuszpk
nagyúr

oke, marad a lotto :D

Első AMD-m - a 65-ös - a seregben volt...

(#5116) Yutani válasza S_x96x_S (#5114) üzenetére


Yutani
nagyúr

Valamiért nekem a SkyBridge koncepció nem az volt, hogy x86 és ARM egy die-on, hanem ugyanabba az alaplapba bele lehetett volna tenni x86 vagy ARM procit. Tehát mondjuk egy AM4 lapba lehetne kapni ARM procit is.

#tarcsad

(#5117) S_x96x_S válasza Yutani (#5116) üzenetére


S_x96x_S
őstag

> Valamiért nekem a SkyBridge koncepció

Az extremetech-es cikk csak egy újságírói továbbgondolása
a SkyBridge-nek.

egy logikus spekuláció.

az eredeti cikkben

"... the puzzle that AMD didn’t mention — an SoC architecture that we ultimately believe could combine ARM and x86 hardware on the same die."

"This article is speculative — AMD has not acknowledged such a strategy at this point — but if you read between the lines a bit, the pattern fits."

:R

Mottó: "A verseny jó!"

(#5118) S_x96x_S


S_x96x_S
őstag

a következő 1-2 hónapban nálunk is megjelenhetnek az "olcsó

Benchmarking AMD Ryzen 5 5500U Linux Performance With A $450 Lenovo Laptop
( Lenovo Ideapad 3 15 with Ryzen 5 5500U )
https://www.phoronix.com/scan.php?page=article&item=lenovo-ryzen5-5500u&num=1

és egy játékteszt ( sakk )

"If taking the geometric mean of all 139 benchmarks, the Ryzen 5 5500U was the fastest of the tested processors by a slim lead. From the Ryzen 5 4500U to 5500U was about 11% higher performance and over the Core i7 1165G7 was about 10% higher performance in these CPU benchmarks. With the graphics tests is where the Intel Tiger Lake came out stronger overall against the Vega-based Radeon graphics found within the 5500U."

Mottó: "A verseny jó!"

(#5119) S_x96x_S


S_x96x_S
őstag

18.ról - 11. pozicióra ugrás - 1 év alatt.
A kombinált XILINX-es egyesülés utánni pozició - még előrébb lesz

AMD: +93%
INTEL: -4%
MEDIATEK: +90%
nVIDIA: +51%
Qualcomm: +55% ( ők vették meg a nuviát, erős ARM-es rivális lesz! )
--------
AMD was No. 11 semiconductor company in Q1 2021.
https://www.tomshardware.com/news/ic-insights-top-15-makers-of-semiconductors

"AMD and MediaTek were two new entrants to the top 15 list of semiconductor companies. AMD significantly increased shipments of its CPUs for servers and high-performance desktops, so its revenue in the first quarter totalled $3.445 billion, up 93% year-over-year. In Q1 2021 AMD was ranked 11th largest semiconductor company in the world. The company was ranked 18 in the first quarter 2020. MediaTek's sales reached $3.849 billion, an increase of 90% year-over-year. AMD and MediaTek replaced Huawei's HiSilicon and Sony's chip division in Top 15. "

Mottó: "A verseny jó!"

(#5120) Petykemano válasza S_x96x_S (#5117) üzenetére


Petykemano
veterán

Ezt a vitát egyszer már lejátszottuk.
Én valahogy nem tudom elképzelni hogy erre - hogy csak egyszer kelljen megvenni a procit,de a kupak alatt kétféle maximálisan profi rendszer legyen, amik között reboottal lehessen váltani - nem tudom ki akarna. Én nem gondolom, hogy ennyire bénakacsák lennének a cloud szolgáltatók, hogy annyira ne legyen elképzelésük, hogy milyen ISA-ra lesz igény 2-5 év múlva, hogy nekik egyenlő mértékben kéne különböző ISA-kból számítási kapacitásra beruházni, mert ki tudja, mit hoz a jövő. Szerintem ők ezt nem annyira lereagálni, mint inkább költség alapon irányítani szeretnék.

Annak esetleg látnám értelmét, hogy olyan heterogén architektúra, amiben egyszerre van jelen az x86 és az arm processzor, mindkettő aktív, de persze csak az egyiket használja a host rendszer, a másik lehetőséggel csak tisztában van és ennek megfelelően tud rajta virtuális futtatási környezetet (VM-et) futtatni.

Ha jól emlékszem, az intelnek volt PCIe slotba dugható compute cardja
[link]

Ha így nézzük, akkor a gpu is egy hasonló. Egy saját ISA-val rendelkező rendszer, amin ezért sajátos módon, sajátos kódot lehet futtatni. Tehát egy x86-os host rendszerbe dugott Arm kártyán miért ne lehetne Arm kódot futtatni? vagy fordítva.

Azt gondolnám, hogy ennek neked otthon, aki esetleg nem engedhetsz meg magadnak két számítógépet, még lenne értelme. De egy nagy cloud szolgáltató miért járna jobban?

Az persze hatalmas húzás lenne az AMD-től, ha kiderülne, hogy az architektúráit mindig is úgy készítette el, hogy ugyanabból a zen-ből létezett egy olyan változat is, ami nem x86, hanem Arm ISA frontenddel rendelkezik. De ha ilyennel rendelkezik, akkor szerintem azzal már előálllt volna, ha úgy gondolná, hogy előnyös a szerverpiacot két irányból támadni. Ha viszont visszatartja azért, hogy majd a megfelelő pillanatban rántsa elő, amikor az Arm adoptációja már erre készen áll, akkor az valójában azt jelenti, hogy valaki ezt az utat - az AMD x86-os törekvései ellenére - kijárta, kitörte, ha ennél nem jobbal áll elő az AMD, akkor ezen a piacon is elvesztette a versenyt, ha viszont jobbal rendelkezik, akkor minek várt vele?

Találgatunk, aztán majd úgyis kiderül..

(#5121) S_x96x_S válasza Petykemano (#5107) üzenetére


S_x96x_S
őstag

> Raphael
> - 28 PCIe 4.0 lanes (+4 compared to Zen 3)

én azért egy kicsit sajnálom, hogy nem lesz rögtön PCIe 5.0 -a a consumer piacon.
Bár eléggé ellenmondó hirek vannak arról, hogy az AlderLake desktop-on most támogatja-e a CXL-t vagy sem ..

azért nekem folyik érte a nyálam. Persze én nem játékra használom, fontos az I/O , latency ..
és hogy mindenféle enterprise-os kütyüket is rá tudjak kötni ..

Az egyetlen reményem - hogy lesz olcsó -mini- Threadripper PCIe5.0 -val - ZEN4-en

főleg most, hogy olvasom, hogy az év végén itt a PCI Express 6.0 -is..
PCI Express 6.0 Status Update: Draft 0.71 Coming Soon, Final Release by End of Year
- 800G Ethernet suppoort ... jajj .. de folyik a nyálam :O ...

Mottó: "A verseny jó!"

(#5122) Petykemano válasza S_x96x_S (#5121) üzenetére


Petykemano
veterán

Én továbbra is azt gondolom, hogy az CPU-chipset összeköttetés lesz csak PCIe4

Találgatunk, aztán majd úgyis kiderül..

(#5123) Petykemano


Petykemano
veterán

"AM5 can get 3 CCDs. But each CCDs will lose 2 cores. This explains the increased TDP(170W) + increased number of pins. Also CCD#1 is designed to get maximum frequency. Other CCDs - maximum energy efficiency. Be skeptical of this information."
[link]

Ennek a "3 CCD esetén -2 mag / CCD"-nek sok értelme nem lenne, hacsaknem arról van szó, hogy egy CCD nem 8 magos. De erre eddig semmi nem utalt.
De az érdekes info, hogy
CCD#1 => max frequency
CCD#X => max efficiency
Ezt nyilván eddig is így csinálták - csak válogatással.

Eközben: AdoredTV emelte a tétet: Genoa náluk már 128 magos
[link]

Mások szerint az nem a Genoa.

Találgatunk, aztán majd úgyis kiderül..

(#5124) S_x96x_S válasza Petykemano (#5120) üzenetére


S_x96x_S
őstag

> Azt gondolnám, hogy ennek neked otthon,
> aki esetleg nem engedhetsz meg magadnak két számítógépet, még lenne értelme.
> De egy nagy cloud szolgáltató miért járna jobban?

mindkettő tisztán gazdasági ok - költséghatékonyság , TCO, business agility

a piac nem statikus; egy beruházás viszont több évre szól ..
és a meglévő gépparknak le kell követni az igényekben bekövetkező változást.
És bár most a COVID miatt jelentős túlkereslet van, eljöhet az az idő, amikor
kapacitás felesleg lesz.

Persze ilyen esetben próbálják legalább az önköltségi árat ( pl. áram, hardver amortizáció )
kitermelni - pl. Spot/ preemptible VM pricing-al ...

https://www.datacenterdynamics.com/en/opinions/complete-guide-spot-instances-aws-azure-and-gcp/
"Most cloud providers divide their pricing models into three categories:
- On demand instances—let you pay for computing power per hour or per second, without long-term commitments or upfront payments. You can increase or decrease resources available to your applications at will.
- Reserved instances—for workloads that run on the cloud in the long term, you can commit to compute instances for a period of betweenone to three years, with the option of paying some of the amount upfront. Reserved instances grant discounts of between 40-75 percent, depending on the cloud provider and the level of commitment.
- Spot instances—spot instances let you bid on unused capacity in the cloud provider's data center. They provide the highest level of discount, up to 90 percent compared to on demand costs."

persze most még ~90% -10% lehet az X86 - ARM megoszlás,
de 4-8 év múlva az ARM feljöhet 30 - 40% -ra is .

de ez az én logikám .. sokszor tévedek .. szóval ne vegyétek készpénznek.

Az is kérdés, hogy az Intel és az AMD közötti licensz-ben jogilag lehet-e valami ezzel kapcsolatos korlátozás ..

De amúgy ..

a piac eldönti! :R

ps:
Ez az én fejemben ez hasonló mint egy ingatlanberuházás ..
pl. Ha a belső tér könnyen átalakítható ; akkor most a covid idején az üres irodákat át lehet alakítani lakássá .. vagy viszont .. Ez az üzleti agilitás - számomra.

Mottó: "A verseny jó!"

(#5125) Petykemano válasza S_x96x_S (#5124) üzenetére


Petykemano
veterán

"persze most még ~90% -10% lehet az X86 - ARM megoszlás,
de 4-8 év múlva az ARM feljöhet 30 - 40% -ra is ."

Ezt nem vonom kétségbe, de ez csaknem az egyik évről a másikra ugrik meg. Nagyjából mindem évben történik beruházás a legújabb szerverekből. (Persze nem minden telephelyen az igaz.)
Ráadásul most elég nagy ugrások is vannak már generációról generációra

Találgatunk, aztán majd úgyis kiderül..

(#5126) HSM válasza Petykemano (#5120) üzenetére


HSM
félisten

"Én valahogy nem tudom elképzelni hogy erre - hogy csak egyszer kelljen megvenni a procit,de a kupak alatt kétféle maximálisan profi rendszer legyen"
Cloud szolgáltatóknak pl. jól jöhetne. Ezzel amúgy szerintem a fő probléma, hogy két processzor költségét fizethetnéd ki, használni viszont egyszerre csak az egyiket tudnád. Viszont az eredeti koncepció szerintem jó volt, hogy a fő beruházás, azaz a szerver kompatibilis X86 és ARM CPU-val is, így ha növelni kell valamelyik kapacitást a másik rovására, akkor csak a CPU-t kell cserélni, nem az egész szervert, amivel nyilván rengeteg idő és költség megspórolható.

[ Szerkesztve ]

(#5127) awexco válasza S_x96x_S (#5118) üzenetére


awexco
őstag

Az én 160.000 huf forintos 4500u -s Lenovo laptopom 6-7 honappal vásárlás után 70-80 al ment feljebb ...

I5-6600K + rx5700xt + LG 24GM77

(#5128) S_x96x_S válasza Petykemano (#5123) üzenetére


S_x96x_S
őstag

> "AM5 can get 3 CCDs. But each CCDs will lose 2 cores.

:Y
3*6 = 18 ..
a mostani 2*8=16 power core - hoz képest
nem valami nagy előrelépés.

meg, ha én tervezném, akkor csak 1 energiahatékony CCD-t
raknék bele .. nem kettőt ..

Lehet, hogy 3 chiplet van benne - de nekem
+1 power +1 energiahatékony +1 GPU
lenne értelmes.
vagy
+2 Power +1Energiahatékony.

Mottó: "A verseny jó!"

(#5129) HSM válasza S_x96x_S (#5128) üzenetére


HSM
félisten

Nekem az nem világos, asztali gépbe mi a csodának energiatakarékos mag? :F
Korábban megmértem a Ryzen 5 3600-asom, egy mag fogyasztása az alap 3,6Ghz-en gyári feszültségen mindössze kb. 4-5W Cinebench R15 terhelés alatt, lásd 1 szál vs. 2 szál: [link]
Nem tűnik ésszerű célnak ez alá menni, amikor egy tipikus asztali gép üresjárati fogyasztása legalább 20-30W monitor nélkül. A memóriavezérlő/IF linkek sokkal inkább tűnnek lényeges fogyasztónak, ha nincs eszetlen paraméterekkel meghajtva a CPU.

Egy notebooknál értem, amikor üresjáratban az egész fogyaszt monitorral együtt 5W körül, de asztalon más a nagyságrend, ahova az AM5-öt szánják.

A háttérfeladatok hatékony végzésére pedig sokkal inkább valami szoftveres megoldásnak látnám értelmét, ami ezekre nem aktiválja a magas, tipikusan nem energiahatékony turbó/boost órajeleket.

Nekem két 8 magos erős CCD és egy GPU csiplet tetszene, lehetőleg CXL-es PCIe5-el. ;]

[ Szerkesztve ]

(#5130) awexco válasza HSM (#5129) üzenetére


awexco
őstag

Kérdés egy szerverparknál menyire számit , hogy mekkora aksiparkot kell kiépiteni stb ...
De asztali gépnél sok jelentősége nincs . Max hamarabb lesz támogatva a dolog . Nem melegszik annyira stb . De valóban nem égető.

I5-6600K + rx5700xt + LG 24GM77

(#5131) Petykemano válasza S_x96x_S (#5128) üzenetére


Petykemano
veterán

> a mostani 2*8=16 power core - hoz képest
> nem valami nagy előrelépés.


Igen.
Most van ez hype a Milan-X-ről, amiről csak azt lehet tudni, hogy valami 3d stacked cucc (3DX) de azzal kapcsolatban, hogy pontosan mi van egymásra pakolva, csak találgatás zajlik.
Elég valószínű, hogy csupán arról van szó, hogy HBM lesz a zen3-as chipletek mellett használva, amire az elmúlt 1 év hírei alapján számítani is lehetett. De van aki felvetette, hogy vajon CCD-k vannak-e egymásra pakolva?

- egyébként megmagyarázná, hogy hogy lenne 128 magos Genoa.

Mindenesetre ezen kezdtem gondolkodni, hogy vajon lehetséges-e, hogy ha már ekörül ekkora hype van, hogy a 2CCD az valójában 2x2 CCD, tehát a normál 24-32 magos és a 3 CCD az 3x2 CCD, de itt már max 7 mag / CCD - és akkor ezzel kijönne 42.

De ennek semmi értelme nem lenne.
Nem így ismerjük az új AMD-t.
Viszont értelmet nyerne a 170W-os TDP keret

> meg, ha én tervezném, akkor csak 1 energiahatékony CCD-t
> raknék bele .. nem kettőt ..

Miért?
Az energiahatékony az nem low power. Energiahatékony az az, hogy 3.5Ghz-en, amit 24-32 mag használata közben valószínűleg elérhet, a kevesebbet fogyaszt, mint a performance típusú.

Abu mondta, hogy lesz RDNA és CCD lapkák cserélhetők lesznek.
A raphael esetén én arra számítok, hogy - és most maradjunk a leakben említett 3 CCD-nél - lesz
3 CCD
2 CCD + 1 IGP
1 CCD + 1 IGP
adabszurdum lehetséges volna 1 CCD + 2 IGP is, ami impozáns lenne, csak megint a memória sávszélesség jelentene probémát

Találgatunk, aztán majd úgyis kiderül..

(#5132) awexco válasza Petykemano (#5131) üzenetére


awexco
őstag

Meg az igp-k nem kicsik ...

I5-6600K + rx5700xt + LG 24GM77

(#5133) S_x96x_S válasza Petykemano (#5131) üzenetére


S_x96x_S
őstag

A 6 core / CCD - re talán
az AVX512 / AVX512-VNNI / AMX lehetne az egyik magyarázat.
( vagy másképpen AVX3-512 )
És az 5nm -mellett még 2 core -t be kellett áldozni, hogy elférjenek
a rengeteg tranzisztorral.

Ráadásul, hogyha túl sürün pakolják - akkor beleütköznek
az AVX-512 Downlocking-ba .. ( ~ throttling )

Ha mindegyik mag mellé
2x futószalagot tennének AVX-512 -ből.
akkor már a magok száma is számít ..

> Az energiahatékony az nem low power.

remélem neked lesz igazad ..
és a power - csak annyit jelent, hogy 5.5Ghz felett túrbozik.
a másik két energiahatékony meg csak 4.5Ghz-ig ;]

> 3 CCD-nél

lehet, hogy a Xilinx FPGA-t is betervezték
- 1 CPU ( Zen4 )
- 1 GPU ( Radeon )
- 1 FPGA ( Xilinx )
És három a magyar igazság :)
persze 6 CPU maggal nem sok értelme van ennek,
de ne ma ébressz fel .. :R

Mottó: "A verseny jó!"

(#5134) Petykemano válasza S_x96x_S (#5133) üzenetére


Petykemano
veterán

Ez már nagyon vagdalkozás részemről, de..
Azt nem tartom valószínűnek, hogy a zen4 CCD magszáma 8-ról 6-ra essen.
De azért amit mondasz,.szöget ütött a fejembe. Az A78 és az X1 lényegében feldolgozók számában és cache méretben különböznek egymástól.
Mennyire lenne bonyi csinálni
- egy zen4 heavy magot, ami 2 x AVX512, meg több cache stb. De csak 6 mag van a CCD-ben.
Célkeresztben a maximális teljesítmény.
- és egy zen4 light magot, ami utasítások terén ugyanazt tudja, csak kevesebb feldolgozó, kevesebb cache. Cserébe 8 mag / CCD. Célkeresztben a perf/W.

Ennek már ugyan sok köze nincs ahhoz, hogy 3 CCD esetén -2 mag, de a Genoa 96 és 128 magos változatára magyarázat lenne. És lényegében ugyanezt látjuk az arm V1 és N2 esetében is.

Találgatunk, aztán majd úgyis kiderül..

(#5135) S_x96x_S válasza Petykemano (#5134) üzenetére


S_x96x_S
őstag

>Mennyire lenne bonyi csinálni
> egy zen4 heavy magot + és egy zen4 light magot,

technikailag kivitelezhető ..

de Cloud-ban szerintem nem sok értelmét látom..

legalábbis, szerver szinten egy 16 magos CPU -t .
4 x 4 core -ra szét lehet bontani egyszerűen ..
de a power CCD -nél nem tudom hogyan lenne célszerű ..
Az eddigi árazási elveket felboritja .. újra ki kellene találni ..

akkor már inkább egy CCD-n belül kellene.
- 8 core / CCD - amiből 2core extra (duplás) és 6 egyszerű.
persze ez se ideális ..
de legalább 1 chiplet-ből megoldható ..
míg a tied 2 különböző CCD

A probléma a szoftveres lekövetése .. átverni a Microsoftton ..
és belerakni a Linux kernel ütemezőjébe.
Ráadásul azt vissza is kell portolni ..
És hogy egy Linux 20.04 LTS megkapja -e a frissítést .. hát kérdéses ..
persze a bencsmarkoknál .. erre lehet mutogatni ..
szóval nem egyszerű ..

Összefoglalva:
- csak Desktop / játék szinten lehetne értelme ..
Szerver szinten nem igazán.

Mottó: "A verseny jó!"

(#5136) S_x96x_S


S_x96x_S
őstag

https://oxide.computer/ Servers as they should be

CPU: 2,048 X86 CORES (AMD MILAN)
MEMORY: UP TO 32TB DRAM
STORAGE: 1024TB OF RAW STORAGE IN NVME
NETWORK SWITCH: INTEL TOFINO
NETWORK SPEED: 100 GBPS
https://oxide.computer/product
https://news.ycombinator.com/item?id=27294471

Mottó: "A verseny jó!"

(#5137) Petykemano válasza S_x96x_S (#5135) üzenetére


Petykemano
veterán

> technikailag kivitelezhető ..
> de Cloud-ban szerintem nem sok értelmét látom..

De hát ezt csinálja az Arm.
A V1 némileg magasabb egyszálas teljesítményre képes és 96 magos processzort lehet vele készíteni (referencia design) az N2 pedig az alacsonyabb egy és magasabb többszálas teljesítményre éleződik ki és 128 magos processzort lehet belőle csinálni.

Ennek se látod értelmét?

Nem feltétlenül kellene vegyíteni a különböző lapkákat - cloudban. Sőt, ott lehet, hogy kifejezetten igény lenne arra, hogy eltérő árazással mérhessék a különböző típusú magokat.

Ugyanakkor - szerintem - a játékokon kívül más szoftvereknél is beüthet az Amdahl törvény - vagyis lehet, hogy nagyon hatékonyan tudja kiszórni szálakra a feladatokat, de lehet egy-egy olyan process, aminél az egyszálas teljesítmény limitáláltsága kihat az egész rendszer teljesítményére.

Ez persze már az ütemezés kérdése - ahogy mondod is. Az operációs rendszernek tisztában kell lennie azzal, hogy vannak olyan magok, amelyek más teljesítménnyel bírnak, mint a többi és azt is meg kell fontolnia, hogy egy szálat érdemes-e oda helyezni - vagyis hogy nem okoz-e azzal nagyobb lassulást, hogy ha egy másik CPU clusterbe helyezett programszál miatt megnövekszik a kommunikációs késleltetés.

Ez a probléma újra és újra visszaköszön, amit azért nem teljesen értek, mert az Intel Turbo boost 3 (vagy melyik) arról szól, hogy van 1-2 mag, amelyik magasabb frekvencia elérésére képes, mint a többi és a legdurvább programszálat oda ütemezi.

És a 2+1 chipletes zen2 és zen3 termékek is úgy működnek - ez a 3950X esetén elég világosan látszott - hogy az egyik CCD jobb minőségű és magasabb frekvencia elérésére képes "golden sample" és mellette van egy átlagos, gyengébb. Tehát az ütemezőnek már ebben az esetben is kutya kötelessége volt megtalálni, hogy ne akármelyik magon, hanem a legerősebbe(ke)n futtassa a programszálakat, amennyiben a program nem terhel minden szálat. Azt gondolnám, hogy itt nem megfelelő egy roundrobin száldobálás, hanem nagyonis tisztában kell lennie az ütemezőnek, hogy melyik cpu száltól milyen teljesítményre számíthat.

Azt mondod, hogy ez valójában nem így van, ez csupán szemfényvesztés, hogy papíron leírható legyen a magasabb frekvencia és az ütemezés szub-optimális működését meg elfedi a "mérési hiba"?

> akkor már inkább egy CCD-n belül kellene.
> - 8 core / CCD - amiből 2core extra (duplás) és 6 egyszerű.
> persze ez se ideális ..
> de legalább 1 chiplet-ből megoldható ..
> míg a tied 2 különböző CCD

Abból a szempontból igazad van, hogy egy ilyen esetben kevesebbet kellene "gondolkodnia" az ütemezőnek, hogy mi lesz a késleltetéssel, mert minden clusteren belül lenne "erős" mag, csak azzal kéne pluszban foglalkozni, hogy azokat a szálakat, amelyeket eddig is valamilyen megfontolásból egy clusterbe rakott, azok közül a legnagyobb igényűt a legerősebb magra tegye. "Csak azzal" - nyilván ez nem egyszerű

Viszont így nem lenne válogatási lehetőség, hogy melyikből mennyit kérek.

Találgatunk, aztán majd úgyis kiderül..

(#5138) Petykemano


Petykemano
veterán

Strix Point: Zen5+Zen4D
[link] [link]

Videocardz

megj: nem lepődnék meg, ha a zen4 és a zen5 között azért lenne még valami töltelék és eltelne ~3 év
vö:
zen: 2017 március
zen+ (azonos node): 2018 április (+13)
zen2 (új node): 2019 július (+15)
zen3 (azonos node): 2020 november (+16)

Találgatunk, aztán majd úgyis kiderül..

(#5139) awexco válasza Petykemano (#5138) üzenetére


awexco
őstag

Azért most , gyorsan ugranak 5 nm-ről 3 ra :)

I5-6600K + rx5700xt + LG 24GM77

(#5140) S_x96x_S válasza Petykemano (#5137) üzenetére


S_x96x_S
őstag

>> de Cloud-ban szerintem nem sok értelmét látom..
> De hát ezt csinálja az Arm.

lehet, hogy nem jól fogalmaztam ..

a Cloud-ban - én :R a homogén magoknak látom értelmét.
vagy másképpen a homogén CCD-knek - egy CPU-n belül.

de tisztán csak praktikusság miatt.


> Azt mondod, hogy ez valójában nem így van, ez csupán

tisztán csak a homogenitás praktikusságára céloztam.

az AM5 - amúgy is Desktop ... és itt már előny lehet ( marketingben is ) az erős egy szálas teljesítménynek. ( ~ erősebb CCD-nek )
A félig Desktop-nak számító: Threadrippernél is lehet értelme..
Az céges EPYC-nél kevesebb ..
Cloud-os EPYC-nél meg még kevesebb.
HPC-s EPYC -nél meg közelít a nullához

> ...ARM .. V1 vs. N2

Ahogy látom:
az X86 -os magok differenciálása a piac számára
jelenleg gyártóspecifikus.
a Cloud-okban találálható
- többfajta Intel
- többfajta AMD ( ZEN2, ZEN3 )
persze ez csak részben fedi le a piaci igényeket.

Stratégiailag többféle lehetősége is lehet az AMD-nek,
ha netalán
egy generáción belül többféle CCD chipletre is lenne erőforrása

1.) hasonlón mint a V1/N2 ..
X86-A64-ből: gyenge sok mag vs. kevesebb erősebb mag.

2.) vagy a merészebb:
erős X86-A64 és erős ARMv9
(mert stratégiailag - jobban megérheti a mérnöki erőforrásokat egy ARMv9-be ölni , .. már a Xilinx miatt is. )

3.) És ott van még az önmagát (bootoláskor) automatikusan átkonfigurálható architektúra ötlete..
amikor a gyenge magok - össze tudnak állni erős magokká.
vagyis
a jelenlegi 8x( 1c/2t ) -ból lehetne még
->> 4x(1c/4t) vagyis 4 erős mag.
->> 2x(1c/8t) vagyis 2 szuper erős mag.
->> vagy 16x(1c/1t) 16 gyenge mag.

de ez csak találgatás és álmodozás részemről ..
:R

Mottó: "A verseny jó!"

(#5141) S_x96x_S válasza S_x96x_S (#5140) üzenetére


S_x96x_S
őstag

na már részben meg is cáfolódtam :K
lásd: --> Hibrid architektúra: [ Zen5 + Zen4D ]

ennyit mára ..

Mottó: "A verseny jó!"

(#5142) TESCO-Zsömle válasza S_x96x_S (#5133) üzenetére


TESCO-Zsömle
félisten

Szerintem valamit félreértelmeztek, mert az energiahatékonyság nem valami egyezményes dolig, ganem egy származtatott eredmény, ami számolható. A 170W-ot zabáló proci is is lehet energiahatékony, ha 2x annyit számol, mint a 100W-os.

Hasznos számítás/fogyasztás. Ennyit jelent az energiahatékonyság.

Sub-Dungeoneer lvl -57

(#5143) TESCO-Zsömle válasza Petykemano (#5131) üzenetére


TESCO-Zsömle
félisten

@2xIGP:

Volt korábban pletyka, hogy APU-k kaphatnak 4-csatornás memóriát, azzal úgy lenne értepme, de ha a kupak alá be tudnak súvasztani 4-8GB HBM-et, az us megoldaná a gondot.

A 170W TDP jót is tenne egy ilyen gamer cuccnak, amivel lehetne valamelyest pótolni a kiesett 300$ alatti videókártya-szegmenst.

Szigorúan szvsz.

Nem tudom mi egyébre lehetne eltolni az 1700 tüskés foglalat adta érintkező-többketet, de kétlem, hogy mind a tápra menne.

Sub-Dungeoneer lvl -57

(#5144) Petykemano válasza TESCO-Zsömle (#5143) üzenetére


Petykemano
veterán

2xIGP - ez lehetne ugye 12, vagy akár 16CU is per CCD, azaz 24 vagy 32.
Az MCM Navi 31 esetén a jelenlegi pletykák arról szólnak, hogy a lapkákat egy közös LastLevelCache-re (Infinity Cache) fűzik föl, más elgondolások szerint a két lapka közé tesznek cache-t, ami megítélésem szerint a másik lapkán levő memóriavezérlő által kezelt memóriatartalom elérését gyorsítja.
A cache tehát mindenképp a memóriatartalom elérésének gyorsítását szolgálja.

Azt gondolnám, hogy egy ilyen APU-ra szereplhető IGP chipletről a memóriavezérlőt ugyanúgy kihagynák, mint a CPU CCD-k esetén.
Ha már létezik (létezni fog) ilyen technológia, hogy különálló cache lapka gyorsít két másik közötti kommunikációt akkor ennek bevetése itt is praktikus lehet. Megfelelő mennyiségű Infinity cache használata kiválthatja a HBM szükségességét.

[IGP CCD]-[IC]-[IO]<->DDR5

Ha jól emlékszem, abu a navi 23-ra ilyen 65W-okat mondott.

De nincsenek illúzióim egy ilyen apu HBM-mel vagy anélkül olyan áron kerülne forgalomba, ami semmiképp se tudna alternatívát jelenteni azok számára, akik amúgy $300 alatti videokártyát vásároltak volna. Az ilyen elképzelésekkel az szokott történni, hogy tök jó lenne egy ilyen desktopos alternatíva, de a desktop/minipc piac túl kicsi, prémium notebookokba talán mehetne, de nagy kereslet arra sincs, és egyébként is egyben hűteni egy ilyen aput nehezebb, mint ha két külön eszköz lenne.

Találgatunk, aztán majd úgyis kiderül..

(#5145) S_x96x_S válasza Petykemano (#5138) üzenetére


S_x96x_S
őstag

még emésztem ...

de APU-nál és Desktop-nál normális a heterogén architektrúra.
"Zen 5 CPU codename Granite Ridge.
Zen5 APU? codename Strix Point (Big Core Zen5+Zen4D Small Core)"
https://twitter.com/9550pro/status/1397812947049533445

Mottó: "A verseny jó!"

(#5146) S_x96x_S válasza HSM (#5129) üzenetére


S_x96x_S
őstag

> lehetőleg CXL-es PCIe5-el.

ajajj .... tényleg kelleni fog az a PCIe 5.0 ...

Marvell Announces First PCIe 5.0 NVMe SSD Controllers: Up To 14 GB/s
"These new SSD controllers roughly double the performance available from PCIe 4.0 SSDs, meaning sequential read throughput hits 14 GB/s and random read performance of around 2M IOPS. To reach this level of performance while staying within the power and thermal limits of common enterprise SSD form factors, Marvell has had to improve power efficiency by 40% over their previous generation SSD controllers."

Mottó: "A verseny jó!"

(#5147) S_x96x_S válasza S_x96x_S (#5146) üzenetére


S_x96x_S
őstag

> PCIe5

egy kicsit megnyugodtam .. :R

az AMD szerepel a "Launch Partners - Ecosystem" slide-on
az Intel és a Renesas mellett.
Van még remény :K

amúgy az STH -s cikk jobb mint az AT-s .. sok sok slide ...
https://www.servethehome.com/marvell-bravera-sc5-offers-2m-iops-and-14gbps-in-a-pcie-gen5-ssd/

A Latency- csökkenés jó lesz .. meglássátok!

A Gen5 és a CXL - miatt a Szerverek gyors elavulását jósolja az STH.

Mottó: "A verseny jó!"

(#5148) S_x96x_S


S_x96x_S
őstag

Jim Keller intervjú .. hosszú ..
érintve a ZEN, Raja Koduri, Riscv, ...

An Interview with Tenstorrent: CEO Ljubisa Bajic and CTO Jim Keller
https://www.anandtech.com/show/16709/an-interview-with-tenstorrent-ceo-ljubisa-bajic-and-cto-jim-keller

IC: Correct me if I’m wrong, but for the time inside AMD, it kind of sounded like Jim’s way or the highway?
JK: I wouldn't say that! The funny thing was, we knew we were kind of at the end of the road - our customers weren’t buying our products, and the stuff on the roadmap wasn’t any good. I didn’t have to convince people very much about that. There were a few people who said ‘you don’t understand Jim, we have an opportunity to make 5%’. But we were off by 2X, and we couldn’t catch up [going down that route]. So I made this chart that summarised that our plan was to ‘fall a little further behind Intel every year until we died’.
With Zen, we were going to catch up in one generation. There were three groups of people - a small group believed it (that Zen would catch Intel in one generation); a medium-sized group of people that thought if it happens, it would be cool; then another group that definitely believed it was impossible. A lot of those people laughed, and some of them kind of soldiered on, despite this belief. There was a lot of cognitive dissonance, but I found all kinds of people that were really enthusiastic.
Mike Clark was the architect of Zen, and I made this list of things we wanted to do [for Zen]. I said to Mike that if we did this it would be great, so why don’t we do it? He said that AMD could do it. My response was to ask why aren't we doing it - he said that everybody else says it would be impossible. I took care of that part. It wasn’t just me, there were lots of people involved in Zen, but it was also about getting people out of the way that were blocking it. It was fun – as I’ve said before, computer design needs to be fun. I try to get people jazzed up about what we’re doing. I did all kinds of crazy stuff to get people out of that kind of desultory hopelessness that they were falling into.

Mottó: "A verseny jó!"

(#5149) S_x96x_S


S_x96x_S
őstag

még egy variáció ..

"AMD Zen 4 Powered Ryzen ‘Raphael’ Desktop CPU Rumors: Over 20% IPC Gain, 16 Core Flagship at Launch, DDR5-5200 on AM5 LGA1718 Socket, 2022 Launch"
Wccftech

( jobb egérklick + új ablakban megnyit és akkor olvasható )

Mottó: "A verseny jó!"

(#5150) Petykemano válasza S_x96x_S (#5149) üzenetére


Petykemano
veterán

A 16 magra gondolsz?

Elég vicces... egy fél éve még attól harsogott a média, hogy a 8/16 magos konzol proci és az ssd vezérlő brutális terhelést fog róni a procikra.
Abu nemrég azt mondta, at FSR nagyobb terhelést dog róni a procikra.

Az AMD meg nem akar több magot adni.

Megy a szerecsenmosdatás. Jójójó, a 8 magos kezdés tényleg nagyszerű volt, letörte a 6+ magos procik árát. De hát ugyanoda tartunk vissza. Jójójó, aztán letörte a 12-16 magosokat is
De a 6 magos procik az 1600/X megjelenése óta nem lettek olcsóbbak, sőt, drágultak is.

:

Találgatunk, aztán majd úgyis kiderül..

Copyright © 2000-2024 PROHARDVER Informatikai Kft.