Hirdetés

2024. április 27., szombat

Gyorskeresés

Hozzászólások

(#6951) Petykemano


Petykemano
veterán

Zen 4 Instruction Based Sampling (IBS)

Samsung 512GB CXL memory module

Találgatunk, aztán majd úgyis kiderül..

(#6952) Petykemano


Petykemano
veterán

"RPL has been produced in small quantities.
PHX is about to begin testing.
Navi3 expects to begin package testing next month."
[link]

Nem tudom, hogy ez melyik termék esetén mennyi időt jelent a rajtig.
De a kis mennyiségben gyártott Raphael alkalmas lehet arra, hogy a Computexen bemutassák.

Találgatunk, aztán majd úgyis kiderül..

(#6953) Petykemano


Petykemano
veterán

/Zen4 - nem biztos információ/

Megjelent kép egy táblázatról, amelyben a 7950X-et 24/48 magos/szálas prociként említik. Olyan $1000-os áron.
[link] [link]

Ennek létezése nem zárható ki.
Ha az AMD tartja magát az IOD felépítésének eddig gyakorlatához, akkor ugye felmerülhetett a kérdés, hogy kvázi 6 db IO lapka van-e összepakolva, amelyben egyenként 2-2 DDR5 csatorna és IFOP van-e, vagy 4db olyan, amiben 3-3?
A kérdést - hogy ezúttal is ugyanazt a megközelítést alkalmazzák-e - persze árnyalja, hogy és akkor a Genoa IO lapkájában van 4/6db olyan IGP, mint a Raphaelben? Vagy akkor az IGP már eleve (3D) tokozva kerülne rá?

Egy ilyen termék némileg magyarázná azt is, hová tűntek a HEDT Threadripperek. (nem a PRO) És magyarázná a 170W-os TDP-t is persze.

Szerintem elég kemény lenne. Mármint ebben a kategóriában az AMD eddig is királynak számított. Igaz, hogy a csutkára húzott Alder Lake megszorongatta az 5950X-et. De azért én nem gondolnám, hogy a Raptor lake-be bekerülő +8 E mag annyival megdobná a MT score-t. Kivéve persze ha az E magokon sokat reszeltek és mondjuk átlag feletti IPC emelkedést hoz.

Találgatunk, aztán majd úgyis kiderül..

(#6954) Devid_81 válasza Petykemano (#6953) üzenetére


Devid_81
nagyúr

Ha arrebb toljak az IO die-t akkor siman elfer 3 CCD a kupak alatt, nem kizart amugy, hogy ezt meglepik, mert az Intel ellen kellhet ha az MT pontok nagyon szamitanak :K

...

(#6955) poci76 válasza Petykemano (#6953) üzenetére


poci76
aktív tag

Korábban gondolkodtam ezen, és nekem is az lenne a logikus, ha a csúcs 24 magos lenne. Az Alder Lake meglepően erős lett. Egyszálas teljesítményben borzasztó erős, és több szálon is sok esetben versenyképes az 5950X-szel. Ebből könnyen lehet az, hogy egy 16 magos Zen 4 és a Raptor Lake ugyanilyen viszonyban lenne, és ez sokakat az Intel felé fordíthat. Egy 24 magos 7950X több szálon biztosan mindent verne a normál desktop kategóriában.

(#6956) Petykemano


Petykemano
veterán

/Genoa/
- SDCI (Smart Data Cache Injection) Accelerator
- SDXI (Smart Data Acceleration Interface) Accelearator
[link]

Más részletek is érdekesek a Dragon Range-ről, Phoenixről, Storm Peak-ről, Bergamoról.
Zen5-ről, Turinról

Elég feszes rajt dátumokat jelöl meg - legalábbis 2023-ra nézve.
2023 elején kéne megjelennie a Dragon Range-nek, a Phoenixnek és a Storm Peak-nek is.
Ez talán annyira nem meglelő. Addigra talán az Apple átvonul az N3 node-ra és felszabadul az N5 kapacitás.
De a Bergamo is 2023 során jelenik meg.

A Zen5 valószínűleg nem N3, hanem N4P gyártástechnológián készül majd. a 256c/512t sűrűségű Zen5-re épülő Turin szintén 2023 végén kerülne piacra. (valószínűleg sampling to selected customers)
Ha ez igaz, akkor nagyjából ezzel egyidőben tehát 2023 végén, 2024 elején meg kéne jelennie a desktop változatnak is.

A jövőben az AMD termékei, amennyiben képes technológiai fölényt szerezni és megtartani, az árak el fognak szállni, mert az AMD a szűkös kapacitásait mindig igyekezni fog a legmagasabb árszegmensben pénzre váltani.

Én azért reménykedem, hogy az alacsonyabb árszegmensekbe majd lecsorog valami, olcsóbb gyártástechnológián készülve.

Találgatunk, aztán majd úgyis kiderül..

(#6957) S_x96x_S


S_x96x_S
őstag

@Petykamano Híres lettél :-) :Y Gratula! :K

TomsHW:
"One of AMD's approaching Ryzen 7000 (Raphael) processors has surfaced. Twitter user Petykemano has unearthed the mysterious 5nm chip hidden deep inside the OpenBenchmarking.org database."
https://www.tomshardware.com/news/amd-zen-4-cpu-emerges-with-52-ghz-boost-rdna-2-igpu

Videocardz:
"Source: OpenBenchmarking via Petykemano"
https://videocardz.com/newz/amd-zen4-raphael-8-core-cpu-with-5-2-ghz-clock-speed-and-gfx1036-rdna2-graphics-spotted

Guru3d
"MD's upcoming Ryzen 7000 (Raphael) processor is exposed. On Twitter Petykemano discovered the unknown 5nm chip in the OpenBenchmarking database."

wccftech:
"News Source: @Petykemano"

Mottó: "A verseny jó!"

(#6958) solfilo válasza S_x96x_S (#6957) üzenetére


solfilo
veterán

Ez igen! Gratula Petykemano! :Y :DD:C

solfilo

(#6959) Petykemano


Petykemano
veterán

:R

Találgatunk, aztán majd úgyis kiderül..

(#6960) S_x96x_S válasza Petykemano (#6956) üzenetére


S_x96x_S
őstag

> SDCI (Smart Data Cache Injection) Accelerator
> SDXI (Smart Data Acceleration Interface) Accelearator

ezt berakhatnák a sima desktopos procikba is.

---------------

Közben a Videocardz is kimazsolázta az infókat
"""
AMD Zen4 MLID claims
15-24% IPC Increase (Over Zen 3)
8-14% Clock Increase (Over Zen 3)
28-37% ST Perf Increase (Over Zen 3)
ST-Like or Higher MT Perf Increase (Over Zen 3)
1 MB L2 / 4 MB L3 Per Core (vs 512 KB / 4 MB L3 per Zen 3 Core)
PCIe 5.0 Support (Increased Lanes)
DDR5/LPDDR5 Memory Support (DDR5-5200+)

EPYC Genoa 7004 (~Q4 2022) – A0 Silicon Taped-Out in March, B0 testing is ongoing
Ryzen 7000 ‘Raphael (~2H 2022) – Samples already running, production soon
Ryzen 7000 Dragon Range (~Q1 2023) – Sampling expected this year
Ryzen 7000 Phoenix (~Q1 2023) – Behind Genoa in testing
Threadripper 7000 Storm Peak (~1H 2023) – Planned
"""

Mottó: "A verseny jó!"

(#6961) hokuszpk válasza Petykemano (#6959) üzenetére


hokuszpk
nagyúr

szépvolt ! remélem csináltál screenshotot, mert úgylátom vészes gyorsasággal eltávolították az openbenchmarking.org adatbázisából a találatot.
-- és most fogalmamsincs mennyi az annyi ;]

[ Szerkesztve ]

Első AMD-m - a 65-ös - a seregben volt...

(#6962) Petykemano válasza hokuszpk (#6961) üzenetére


Petykemano
veterán

Én nem. Igazából fogalmam sem volt, hogy ez egy ekkora hír lesz. Nekem nincsenek meg a szükséges infóim más forrásból, hogy meg tudjam állapítani, hogy ez valami kamu-e.

De a videocardz csinált. Ők már ebben gyakorlottak.

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#6963) -FreaK- válasza S_x96x_S (#6957) üzenetére


-FreaK-
veterán

Az oszt igen, gratula Petykemano! :C

(#6964) S_x96x_S


S_x96x_S
őstag

kezdenek jobban szivárogni a hírek..

"AMD EPYC “Genoa” and “Turin” rumored to support a new SP6 socket, Genoa-X also planned"
https://videocardz.com/newz/amd-epyc-genoa-and-turin-rumored-to-support-a-new-sp6-socket-genoa-x-also-planned

Mottó: "A verseny jó!"

(#6965) Petykemano válasza S_x96x_S (#6964) üzenetére


Petykemano
veterán

Megérkezik az abu által is többször emlegetett kis--epyc platform.

Mit gondolsz, a TR PRO onnantól kezdve ebből (SP6) deriválódik? Vagy az SP5-ből lesz TR PRO, SP6-ból új életre kel a TR?

Találgatunk, aztán majd úgyis kiderül..

(#6966) S_x96x_S válasza Petykemano (#6965) üzenetére


S_x96x_S
őstag

> Vagy az SP5-ből lesz TR PRO, SP6-ból új életre kel a TR?

inkább ez lehet a valószínűbb
főleg ha az Intellel való verseny felől nézem.

igazából a szegmentálás a túl magas magszám miatt szükséges,
amit már 2 foglalattal nem lehet gazdaságosan lefedni.
és kell egy "középkategória" ...

spekuláció:
az új TR-ek sem 2 csoportba fognak esni ( "PRO" és a "nem PRO" )
hanem többféle teljesen új szegmentáció lesz.
mert pl. ott van a "sötét ló" az Exascale APU ( Zen 4 CPU & CDNA 3 GPU cores )
ami szerintem jó lenne NUC-os kivitelben. ( habár ott ‘SH5’ socket -et emlegetnek )

Mottó: "A verseny jó!"

(#6967) S_x96x_S válasza Petykemano (#6965) üzenetére


S_x96x_S
őstag

> kis--epyc platform.

max 32 Zen4 core ;
Ha viszont ez igaz, akkor én az AM5-be nem nagyon várok 24 és 32 magos ZEN4-es proci-t.

SP6 ( via Videocardz )
"According to those slides, this socket would support up to 32-core Genoa (Zen4) EPYC processors and up to 64-core Bergamo (Zen4c) series. The power would also be limited to 225W, which is nearly half of what the full SP5 socket can support."

Mottó: "A verseny jó!"

(#6968) Petykemano válasza S_x96x_S (#6967) üzenetére


Petykemano
veterán

"Ha viszont ez igaz, akkor én az AM5-be nem nagyon várok 24 és 32 magos ZEN4-es proci-t."

Hát igen.
Annak látod esélyét, hogy a TR gyorsítókkal különböztesse meg magát a desktop vonaltól?

Találgatunk, aztán majd úgyis kiderül..

(#6969) S_x96x_S válasza Petykemano (#6968) üzenetére


S_x96x_S
őstag

> Annak látod esélyét, hogy a TR gyorsítókkal
> különböztesse meg magát a desktop vonaltól?

én (hosszú távon) a desktop-os és a notebook-os vonalra is várok gyorsítókat.
habár ott szerintem főleg csak az RDNA3 várható ..
( és ami talán alkalmas CDNA fejlesztésre is )

FPGA:
Persze ott van még a XILINX is : https://www.theregister.com/2022/05/09/amd_xilinx_datacenter/
ami szerintem szintén le fog szivárogni.
És ez a fejlesztők miatt is van;
ha "elérhető" a hardver , akkor egyre több programba építik be,
ami jót tesz a szerveres piacnak is.

és valamennyire az AVX-512 is gyorsítónak számít
.. ami szintén lesz a ZEN4-es magokban.

de mintha az SP6-nak elsődlegesen a Low-Cost szerverpiac lenne a célja, amit most az Intel teljesen dominál.
- 70-225W <-----
- 6ch DDR5
- 96Line PCIe Gen5
- 48 CXL v1.1+
- 8Line PCIe Gen3

és ha az AM5 - -170W TDP- jét megduplázzuk, akkor már 340W-nál járunk; és ez már az SP5 területe ..
Vagyis egy rendes csúcsrajáratott (>5GHz) 32 magos Threadripper csak az SP5-ben lesz értelmes döntés - mert akkora a fogyasztása.

az SP6 mintha a mostani inteles XE vonalat próbálná megcélozni - amolyan HEDT -ként.

de amúgy túl sok a nyitott lehetőség ..

Ami még érdekes az az SP3 és az SP6 pont egyező fizikai mérete
Socket SP3 – LGA 4094 - 58.5 x 75.4 mm <----
Socket SP5 – LGA 6096 – 76.0 x 80.0 mm
Socket SP6 – LGA 4844 - 58.5 x 75.4 mm <----
mindha a jelenlegi SP3-as szervertermek fizikai lecserélése is cél lenne, amit a jelenlegi ügyfelek kértek.
Maradnak a rekeszek és a szekrények .. csak új alaplap kerül bele ..
és ide az SP5 már fizikailag nem jó, mert sokkal nagyobb ..
nem mindenki akarja szétbombázni a szervertermet - pár milliméter miatt.

Mottó: "A verseny jó!"

(#6970) S_x96x_S válasza Petykemano (#6956) üzenetére


S_x96x_S
őstag

> Én azért reménykedem, hogy az alacsonyabb árszegmensekbe majd
> lecsorog valami, olcsóbb gyártástechnológián készülve.

valamikor majd igen :O .. de az nem most lesz ..

https://www.theregister.com/2022/05/13/tsmc_samsung_price_hikes/
TSMC, Samsung plan price hikes for chip designers – reports
Nvidia, AMD, Apple et al may be forced to pass cost on to customers


- Samsung is planning to raise prices for chip designers by 15-20 percent this year,
- TSMC is planning price hikes in the single-digit percentages for legacy and advanced chip manufacturing technologies next year. Citing industry sources, Nikkei reported that the price hike will be around five to eight percent

és ha ez igaz..
akkor a DDR5 memóriák árai is csak nagyon lassan sülyednek.
ajajj ...

Mottó: "A verseny jó!"

(#6971) S_x96x_S válasza hokuszpk (#6961) üzenetére


S_x96x_S
őstag

>> ... @Petykemano leak
> mert úgylátom vészes gyorsasággal eltávolították az
> openbenchmarking.org adatbázisából a találatot.

a Phoronix-os Michael - rendszeresen takarítja :-)

https://twitter.com/phoronix/status/1525799384167874563
du. 1:24 · 2022. máj. 15
"As various sites seem to keep talking about it... There was a reported #Zen4 entry people found a few days ago on @OpenBenchmark uploaded by some third party/individual. Unknown why it was uploaded as it's always optional, but in any event I removed it without prompt. 1/
I routinely remove such entries proactively when noticing potentially unannounced hw / other results users likely didn't intend to upload (or asking it to be removed). So no conspiracies & it's opensource so use judgment when things could be potentially fabbed by user ~Michael"

Mottó: "A verseny jó!"

(#6972) Petykemano


Petykemano
veterán

Napvilágot láttak a Raptor Lake cache számai.
Itt is az L2$ növekszik, mint a zen4 esetén.
P: 1.25MB => 2MB
E: 2MB => 4 MB

Már az Alder Lake esetén felmerült, hogy a $300-os 6+4 magos i5 tulajdonképpen eléggé versenyképes az akkor még jóval drágább 8 magos 5800X-szel. Egyesek szerint a 6P + 8e magos - i5 13600K néven és szegmensben várható - Raptor Lake már nagy valószínűséggel gyorsabb ia lesz, mint a 8 magos Raphael. De minimum legalább ugyanannyira versenyképes. [link]

Bár az AMD árait elsősorban nem a desktop piaci verseny, hanem az ide maradó kapacitás szokta meghatározni, de azért marketing szempontból blama lenne épphogy versenyképes terméket érezhetően drágábban megjelentetni.

Arról már volt szó, hogy a 8P+16E magos Raptor lake ellen lehet, hogy nem lesz elég a 16 magos Raphael. Versenyképes - főleg fogyasztásban - éppenséggel lehet, de az Végülis egy presztízskérdés lehet, hogy átengedi- e az AMD a koronát. Ez indokolhatja a 24 magos sku létét.

Feltételezvén, hogy az Intel tartja a szegmensek árazását, az alsóbb szegmens is nyomás alá kerülhet. Nem biztos, hogy egy $300-os 13600K mellett el.lehet adni új platformban $400-500-ért egy 8 magos Raphaelt.

Eddig nem tartottam valószínűnek, de most lehetségesnek tűnik, hogy a versenyhelyzet tényleg arra késztethezi az AMD-t, hogy fölülre betoljon egy 24 magos SKU-t, ami mindent eggyel letol.
Vagyis vagy a Ryzen 5 7600X lehet egy 8 magos oéldány $300-ért, vagy az 5700X utódaként jön a szintén 8 magos Ryzen 7 7700X, de az is $300-ért.
(Mármint persze az árak attól függnek, hogy a 13600K milyen áron jön. Tehát pl a $350 nyitóár sem zárható ki )

Találgatunk, aztán majd úgyis kiderül..

(#6973) poci76 válasza Petykemano (#6972) üzenetére


poci76
aktív tag

Örvendetes, hogy van verseny.

(#6974) Petykemano


Petykemano
veterán

Mesa 22.1:
"AMD GFX1036 / GFX1037 support. "
(Raphael IGP)

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#6975) Petykemano válasza poci76 (#6973) üzenetére


Petykemano
veterán

Gondolkodtam.

Ismerve az AMD jelenlegi hozzáállását és rendelkezésére álló kapacitásait szerintem a következő fog történni:

A zen4 előbb jön (Q3), mint a Raptor Lake (Q4), ezért nagy biztonsággal pakolhatja ki az AMD a szokásos felhozatalt akár a kurrens zen3 fölé:
Ryzen 9 7950X - 16c: ~$800-900
Ryzen 9 7900X - 12c: ~$550-600
Ryzen 7 7800X - 8c: $400-450
Ryzen 5 7600X - 6c: $300-350
A magasabb árat lehet indokolni a komoly ST teljesítmény növekedéssel - ami persze tulajdonképpen a mérésekben csak beéri a legerősebb Alder LAke-t, de már csupán 30%-os ST teljesítménynövekedéssel élre ugrik a 7950X megelőzve a brutális fogyasztással hajtott 12900KS-t. Másrészt pedig az IGP-vel.
A valóságban persze az árakat inkább a kapacitás korlátokhoz igazítják.

Aztán megérkezik a Raptor Lake Q4-ben. Potenciálisan visszaveszi a ST elsőséget és szerintem még akkor is esélyes a MT korona elvételére, ha az AMD kitolna egy all-core 5Ghz-es 16 magos procit. (Most én itt részletes számolásokba nem mentem bele, csak nagyvonalakban vázolom az elképzeléseimet)

AdoredTV leakjei alapján tudjuk, hogy a Bergamo és a GenoaX 2023Q1-ben rajtol. TEhát Q4-ben már gyártani kell a 16 magos Zen4c/Zen4D lapkákat és a 3D tokozást is.
(Nem biztos, hogy a Zen4 esetén ugyanazt a megoldást fogják látni, hogy rátesznek a tetejére egy szint L3$ kiterjesztést. Hiszen láthattuk, hogy ennek pozitív hatása azért eléggé korlátozott néhány professzionális alkalmazásra és a játékokra, tehát érdemes lehet gondolkodni valamilyen megoldáson, hogy más területen is hasznosítható legyen

Ez azt jelenti, hogy legkésőbb Q1-ben az AMD meg tud jelentetni a Raptor Lake ellen egy olyan terméket, ami a pletykáltaknak megfelelően 24 magos és
- egyrészről egy 8 magos Zen4 lapkából áll. Ezt lehet cizelllálni egy 3D tokozott L3$-sel a Single/low-thread / Gaming teljesítmény maximalizálására
- másrészről egy 16 magos bergamo Zen4c/Zen4d lapkából a MultiThread teljesítmény maximalizálására.

Ennek a megközelítésnek az előnye az, hogy nem kell azon gondolkodni, hogy vajon a szubsztráton elfér-e 3CCD és hogy az IOD ki tud-e szoglálni 3 CCD-t. Mert úgy lesz a végén 24 mag, hogy csak 2 CCD van. Mégis a lehetőségekhez képest a ST és a MT is ki van maxolva.

Hátránya persze az, hogy ez egy heterogén architektúra. Legalábbis valamivel heterogénebb, mint az eddigi 2CCD-s modellek. De azért azt ne felejtsük el, hogy egy 2 CCD-s sku esetén a szálkezelőnek eddig is tisztában kellett lennie hogy melyik CCD-n vannak a magasabb frekvenciát elérni képes magok. Persze egy tévedés ebben az esetben legfeljebb 5-10%-os teljesítménykülönbségben, vagy ingadozásban nyilvánult meg. a 3D tokozott L3$-sel rendelkező fullos Zen4 magok és az alacsonyabb órajelre optimalizált Zen4c magok között ennél nyilván lényegesen nagyobb különbség is mutatkozhat.
Amennyiben ezt el akarja kerülni az AMD, akkor a 24 mag összejöhet úgy is, hogy vágott Zen4c magokat tesz a CCD-re. De ebben az esetben a Zen4c CCD gyártását nem tudja olyan mértékben sűrűségre optimalizálni, mert ha ennek kell kiszolgálnia a single/low thread igényeket is, akkor nem engedheti meg magának, hogy csak alacsony órajeleket érjen el.

Találgatunk, aztán majd úgyis kiderül..

(#6976) S_x96x_S válasza Petykemano (#6972) üzenetére


S_x96x_S
őstag

> AMD ... a 24 magos sku

nem tudom, hogy technikailag mennyire könnyű megvalósítani.
vagyis, hogy 2 -nél több chipetet tud-e kezelni a desktopos io-die

A ZEN4 3D V-cache -s verzió viszont talán már jövő év elején is kijöhet.
én inkább erre fogadnék. Bár nem lesz olcsó ..

a ZEN5 (8) + ZEN4D (16) - az pont 24 magos
de csak egy generációval később jön.
Ami furcsa lesz nekem, hogy míg az AVX-512 támogatást az AMD kiemeli majd ...
az Intel meg gondban lesz ezzel
( letiltsa-e a Power magokban vagy engedélyezze )

Agner ( cpu programozási guru) Alder Lake-es
véleménye pár napja nagyot keringet a neten ..

"It is very difficult to optimize the software execution for this hybrid system. A further complication is that a P core can run two threads in the same core so that each thread gets half of the resources. This is what Intel call hyperthreading. A program thread may run in three different configurations with different performance parameters:
- Running alone in a P core with maximum performance
- Sharing a P core with another thread, giving half the resources
- Running in a low-power E core
It is completely unrealistic that an application program can handle this situation in a reasonable manner and optimally allocate different threads to the different cores. Hardly any software application company can afford to make different versions of their code for every new microprocessor model and verify, maintain, and support all these versions. ....
"

"The way that Windows 11 handles this problem is still flawed, however. The system is giving high priority only to the thread that has the user focus. This ignores the behavior of many users. A user who is waiting for the computer to finish a heavy duty task is typically not just sitting and waiting. He/she is more likely to do something else during the waiting time, for example checking mails[2]. There are various technical options that the user can use to control the prioritization of threads, but it is unreasonable to require that the user understands and masters such options when the user's attention is on a complicated calculation task rather than on the hardware details of a specific computer. It is already quite difficult to optimize for hyperthreading, as I have argued before[7]. The hybrid design of the Alder Lake just makes the optimization an order of magnitide more complicated. It looks like the hardware designers have unrealistic expectations of how much software designs can be attuned to processor-specific peculiarities."
- Intel's New Chimera: Alder Lake (agner.org)
( + a Hacker News-os thread akit érdekel)

persze ezzel majd az AMD-nak is meg kell küzdenie majd a ZEN5+ZEN4D-s kimérájával :-)

mindenesetre a "8 mag feletti játékokra" !
a homogén ZEN4 -magos gép talán szerencsésebb választás.
( persze az árak sok mindent felülirhatnak )

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#6977) Petykemano válasza S_x96x_S (#6976) üzenetére


Petykemano
veterán

> vagyis, hogy 2 -nél több chipetet tud-e kezelni a desktopos io-die

Ezt a kérdést kiküszöbli Zen4+Zen4D, ami 2023Q1-ben gyártható.

> Ami furcsa lesz nekem, hogy míg az AVX-512 támogatást az AMD kiemeli majd ...

AdoredTV utolsó videója szerint a Genoa és a Bergamo is támogatni fogja az AVX512 utasításokat, 256b-es Load/Store műveletekkel, de a tényleges művelet végrehajtás elvileg 512bites lesz.
Az AMD helyében én azt csinálnám, hogy a Zen4D esetén a műveletvégrehajtást is kettévágnám 256bites szeletekre. és akkor kisebb a mag, de az ISA támogatás ugyanaz.

> Agner on Aldder Lake

AZ elején említi, hogy azért nehéz tájékozódnia a programnak vagy az operációs rendszernek, mnert a DRM miatt egységesíteni kellett a P és E magok CPUID-jét. Bármilyen hülyén hangzik is, de szerintem ez egy nem várt probléma az Intel részéről, amire csak egy rossz megoldást tudtak adni. Azt gondolom, hogy ha nem CPUID-vel, akkor valamilyen más módon megoldást fognak találni arra, hogy a magok megkülönböztethetők legyenek egymástól.

Másrészről a Ryzen és szerintem az Intel cpu-k esetén is valahogy tudatható a rendszerrel, hogy melyik a legjobb és második legjobb mag. Az más kérdés, hogy ezzel aztán mi mit kezd, de nyilván ez a fajta megkülönböztetés szintén kiterjeszthető.

Harmadrészt sajnálatos, hogy Agner Fog irományában egy árva szó nem esik az Arm-ról. Pedig az ARM esetén évek óta létezik a külön clusterba szervezett kis és nagy magok megkülönböztetése, a klaszterezés első generációja a big.LITTLE volt, most tudtommal a DinamIQ néven fut. De még ha feltételezzük is azt, hogy ez annyira egyszerű, mint ahogy az Intel Thread Director csinálja, vagyis hogy a Foreground applikáció fut a nagymagos clusteren és minden más background folyamat a kismagos clusteren, amiről ugye Agner is azt mondja, hogy ez desktop környezetben nem jó megközelítés. Akkor is ma már a nagymagos clusterben is kétféle mag van: a Cortex X1/X2 típusú és a Cortex A78/A710. Ebben az esetben az Arm hogy csinálja? hogy különböztetik meg ezeket a magokat? Teljesen véletlenszerű lenne, hogy a nagymagos clusterben a programszálat az X_ vagy a A7_ típusú mag kezeli?

Találgatunk, aztán majd úgyis kiderül..

(#6978) S_x96x_S válasza Petykemano (#6977) üzenetére


S_x96x_S
őstag

> az Arm hogy csinálja?

macOS - M1
ExtremeTech ( May 18, 2021) )
"Apple, in other words, has changed the way macOS treats the M1 to prioritize responsiveness. Instead of being used to execute background tasks or OS updates, the FireStorm cores are reserved for high-priority applications. If the application demands maximum performance, it can still run across all eight cores, even though this is probably more likely to cause some degree of desktop lag. The system will preferentially run OS tasks in-background, even when this makes them execute much more slowly, in the name of keeping power consumption low.

There’s no specific reason why an x86 CPU couldn’t be run in this fashion. "
""

Az ARM-es Windows-nál meg majd meglátjuk,
de szerintem a hasonló lehet mint az X86-nál.

Mottó: "A verseny jó!"

(#6979) Petykemano válasza S_x96x_S (#6978) üzenetére


Petykemano
veterán

Ehhez a működéshez az applikációnak és/vagy az OS-nek tudnia kell, melyik mag melyik. Az Arm esetén a kis és nagy magok megkülönböztetése feltételezem már egy ideje adottságnak tekinthető.
Másrészt az általad bevágott szövegben kulcsfontosságú kifejezés az, hogy high-priority applications - tehát ezt is tudni kell. Nyilván erre vonatkozólag az Intel azon megközelítése, hogy ami az aktív user fókuszt kapja, az a high-priority - nem jó.

Viszont szerintem van itt egy másik probléma is.
Az Arm és az Apple esetében is a kis magok létezésének célja tényleg az, hogy a háttérfolyamatokata lehető legkisebb energiabefektetés mellett elvigyék.
Ennek megfelelően nem is törekednek arra a designokban a kis magok számát szaporítsák.

Az Intel esetén viszont a kis magok célja nem ez, hanem a MT teljesítmény növelése alacsonyabb energia és helyigény mellett. Az Alder Lake esetén egyébként ez a "high priority applications" megközelítés még nem szúrt volna szemet. De Mondjuk az már elég hülyén nézne ki, hogy ott van a Raptor Lake.ben 16 E mag, ami mondjuk egy blender renderelésben nem vesz részt.

Mondani nyilván könnyű, de szerintem valahogy úgy kéne kinéznie, hogy a background taszkok mindenképpen az E magra üzemeződnek.
A high-priority taszkok mindent is használhatnak, de affinitással rendelkeznek a nagy magokra. Ez azt jelenti, hogy alacsony szálszám esetén csak a nagy magon fut, nagy szálszám esetén terjed át az E magokra.
A user fókusszal rendelkező program pedig kitúrhat mindent és bármit a P magokról.

Ennek egyébként a Zen5+Zen4D esetén is pont így kellene működnie.

[ Szerkesztve ]

Találgatunk, aztán majd úgyis kiderül..

(#6980) S_x96x_S válasza Petykemano (#6979) üzenetére


S_x96x_S
őstag

> scheduler ..
> Ennek egyébként a Zen5+Zen4D

az ütemezés - szerencsére szoftveres, amin könnyű változtatni.

És talán az Alder+Raptor Lake kitapossa az utat egy optimalizáltabb scheduler felé ..
amit már a Zen5 -is tud használni.

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#6981) S_x96x_S


S_x96x_S
őstag

várhatóan.
X670, X670E, B650 chipsets -et bejelentik a Computex-en.

"We can now tell you that the X670E will be a special SKU where the E stands for Extreme. Based on the information we’ve managed to source, it doesn’t seem to differ from the X670 chipset in terms of functionality or features. However, all X670E motherboards must offer PCIe 5.0 connectivity to both the GPU and the M.2 NVMe SSD slot or possibly slots, whereas X670 based motherboards can use PCIe 4.0 instead […]"

May23 ...

Mottó: "A verseny jó!"

(#6982) Petykemano válasza S_x96x_S (#6981) üzenetére


Petykemano
veterán

Hát akkor legalább az AM5 Rembrandt-ot is be kéne jelenteni hozzá.

Bár Szerintem eléggé csalódást keltő lenne, ha a CES után a Computex is csak a Rembrandtról szólna. Ezért szerintem akkor be kell jelenteni a Zen4-et is. Teaser már volt a CES-en. Tehát legalább néhány SKU-t és teljesítményábrákat kell mutogatniuk, mégha a piaci rajt esetleg csak júliusban lesz is.

május 23. Vagyis 5 és 2+3=5. Mint 5nm.
Minden jel erre mutat.

Találgatunk, aztán majd úgyis kiderül..

(#6983) poci76 válasza S_x96x_S (#6976) üzenetére


poci76
aktív tag

Tapasztalatom szerint korántsem ennyire problémás az E és P magok ütemezése. A P magon két szál fut, így az egy szálra jutó számítási teljesítmény nincs messze egy E magra jutó számítási teljesítménytől, így minden optimalizálás nélkül is egész jól ki lehet használni a processzort. Nekem nagy meglepetést okozott a 12900K a 10850K után, mert nem számítottam túl nagy sebességnövekedésre.

Egy szimuláció, amivel nézni szoktam, hogy milyen gyors a proci, a következő futási időket produkálta. A szimulátor nincs optimalizálva heterogén magokra (annál is inkább, mert 2017-es):

Ryzen 3 1200 => 119.753 seconds
Ryzen 7 1800X => 77.733 seconds +54%
Threadripper 1920X => 53.300 seconds +46%
Core i9 10850K => 49.072 seconds +9%
Core i9 12900K => 28.737 seconds +65%

(#6984) S_x96x_S válasza poci76 (#6983) üzenetére


S_x96x_S
őstag

> A P magon két szál fut, így az egy szálra jutó számítási
> teljesítmény nincs messze egy E magra jutó számítási teljesítménytől,
> így minden optimalizálás nélkül is egész jól ki
> lehet használni a processzort.

pragmatikusan igazad van ..

a valóság viszont szerintem sokkal komplexebb ..
- programja válogatja valamint
- agner maximalista :-)

vannak jól és egyszerűen párhuzamosítható programok.
amelyek sok pici homogén taskot tartalmaznak.
ilyenkor nincs nagy következménye egy nem optimális ütemezésnek.
De ha heterogén méretű (és fontosságú) taskokat kell a P és az E-s magokra tenni, akkor tudni kell pontosan hogy mit lehet várni az
- AlderLake -től
- RaptorLake-től
- MeteorLake-től.
- Zen5+zen4D -től.
mindegyik egy picit más lesz.
És ez egy játéknál akár 2-8% extra fps különbséget is okozhat.

> A szimulátor nincs optimalizálva heterogén magokra

szerintem agner arra célzott, hogy a te esetedben
- ha sok pici,homogén taskokkal dolgozik a szimulátor, akkor nincs gond,
és optimalizálással se lehetne túl sokat nyerni..
- de más esetben optimalizálással akár +5 - 15% is el lehetne érni,
mert a hardver képes lenne rá.

egy felhasználó a heterogén architektúrával
- valamit nyer ( mert több hardver fér be a TDP keretbe )
- és valamit veszít, mert a többletet nem mindig tudja kihasználni 100%-ban optimalizációs okok miatt.

A ZEN4 (homogén magok) és a Alder/RaptorLake-nél ( heterogén magok) teljesen felborul a régi heurisztika, hogy
melyik processzornak melyik program fekszik jól.
A Cinebench pl. egy jól párhuzamosítható feladat a ZEN1-3 nak jól feküdt - az akkori intelnek meg nem. Most lehet, hogy fordul a kocka.

persze a fentiek a ZEN1-re is részben igazak .. az i/o die és a belső chipletes felépítés ott is okozott valamilyen problémát, amit a fordító programoknak le kellett kezelni .. de az a probléma relative egyszerűbbnek tűnik mint a mostani - heterogén optimalizálás.

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#6985) S_x96x_S


S_x96x_S
őstag

azta .. valami lesz a computexen ...

- ASRock reveals X670 Taichi motherboard design for upcoming Ryzen 7000 CPUs
- Gigabyte confirms AMD X670 AORUS & AERO motherboards will be showcased at Computex 2022

[…] Moreover, the latest AMD Socket AM5 motherboards including the gaming series of X670 AORUS XTREME, MASTER, PRO AX, and X670 AERO D for designers will be first exposed in this exhibition as well. Users can take a sneak peek at the advanced design and extensive features of PCIe 5.0 graphics slot and M.2 Gen5 interface on GIGABYTE motherboards.
— GIGABYTE

Mottó: "A verseny jó!"

(#6986) Petykemano válasza S_x96x_S (#6985) üzenetére


Petykemano
veterán

Úgy tűnik AM5 bemutató az lesz.

Hát most akkor lehet tippelni, hogy vajon bejelentik a Raphaelt, mint nagy attrakciót az AM5-höz, vagy csak a Rembrandt-ot.

Szerintem a Rembrandt nem egy olyan nagy wasistdas, hogy érdemes legyen ráépíteni a bemutatót.
Tehát én arra számítok, hogy az AM5 elrajtol most. És elrajtol a Rembrandt is. És akkor van értelme piacra dobni.
De bejelentésre kerül a Raphael is, mint fő attrakció, ami viszont majd csak nyáron válik elérhetővé.

Találgatunk, aztán majd úgyis kiderül..

(#6987) Petykemano


Petykemano
veterán

"The VRM delivery for X670E/X670 looks insane.
X570 Taichi - 16 Phases
TR40 Taichi - 16 Phases
Z690 Taichi - 20 Phases
X670 Taichi - 26 Phases"
[link]

Ugh...

Találgatunk, aztán majd úgyis kiderül..

(#6988) TESCO-Zsömle válasza Petykemano (#6987) üzenetére


TESCO-Zsömle
félisten

+60% TDP-hez +60% fázis. Nincs itt semmi látnivaló, kéremszépen...

[ Szerkesztve ]

Sub-Dungeoneer lvl -57

(#6989) Petykemano


Petykemano
veterán

Nem mai hír, de a Benchleaks szerint a Raphael B1-es steppinggel fog megjelenni:

Looks like Raphael got it's production model ID (the previous one was 96), probably stepping RPL-B1. AMD Eng Sample: 100-000000514-03_N AuthenticAMD Family 25 Model 97 Stepping 1 / A60F11
[link]

Találgatunk, aztán majd úgyis kiderül..

(#6991) regener válasza S_x96x_S (#6990) üzenetére


regener
veterán

Tehát igaz lesz, hogy a B650-en csak 1 lesz azokból?

(#6992) S_x96x_S válasza regener (#6991) üzenetére


S_x96x_S
őstag

> Tehát igaz lesz, hogy a B650-en csak 1 lesz azokból?

talán,
de majd ha látunk egy B650-es deszkát, én akkor mennék biztosra.

Mottó: "A verseny jó!"

(#6993) Pakmara válasza S_x96x_S (#6992) üzenetére


Pakmara
őstag

Mi lehet ennek a funkciója? Hőtermelés/méret miatt szedték ketté?

(#6994) S_x96x_S válasza Pakmara (#6993) üzenetére


S_x96x_S
őstag

> Mi lehet ennek a funkciója? Hőtermelés/méret miatt szedték ketté?

leginkább gyártási költség!
és optimalizált raktárkészlet ..
... mint a chipset-nél.
de a hőtermelés is előny ..

Elméletileg a "B"-be egyet raknak.
az X-be meg kettőt.
Az is lehet, hogy az ( erősebb) notebook-ba is ez megy.

mégvadabb ötlet: Threadriper-be meg 4-et ?

Mottó: "A verseny jó!"

(#6995) HSM válasza S_x96x_S (#6976) üzenetére


HSM
félisten

Teljes mértékben egyetértek vele. :K
Nem véletlen írtam már januárban: "a skálázódási probléma megoldási kényszerének áthárítására a szoftverekre, szoftverfejlesztőkre" [link] .
Illetve: "...a hardveresek átdobták a problémát a szoftvereseknek, amiből ritkán szoktak jó dolgok kisülni" [link] (Itt írtam az ARM megoldásáról is.)
De 2021 közepéről is érdekes az utolsó bekezdés innen: [link] .

"persze ezzel majd az AMD-nak is meg kell küzdenie majd"
Úgyérted a szoftverfejlesztőknek, akiknek +1 speciális architektúrára kell majd optimalizálni? ;]
Egyébként szerintem lehet(ne) ezt okosan csinálni, hogy kellőképpen hasonlóak legyenek a magok ahhoz, hogy ne legyen ennyire kényes kérdés, mi, hova ütemeződik. Tehát a jó irány szerintem az lenne, ha azonos módon kellene optimalizálni a magokra, elég lenne az, hogy a magasabb prioritású feladatok a gyorsabb, az alacsonyabbak a lassabb magokon futnának és a szoftverfejlesztőnek nem kellene másra már figyelnie.

#6977 Petykemano: Ha jól tudom, ARM alatt az EAS rendszer segít be [link] . (Itt is ír pár dolgot, ami talán hasznos [link] .)
De ez nem teljesen ugyanaz a probléma, hiszen mobilon a prioritás az energiatakarékosság, míg az Alder esetében a marketing khm, innováció, akarom mondani "throughput". Tehát röviden papíron az ARM azt csinálja, hogy arra a magra igyekeznek rakni a feladatokat, ami a leghatékonyabban el tudja végezni azokat. Abba most ne menjünk bele, hogy ez a rendszer sem olyan szép a gyakorlatban, mint így leírva.... :)

#6980 S_x96x_S: "az ütemezés - szerencsére szoftveres, amin könnyű változtatni."
Az Alder problémájának azt a részét nem fogja az ütemező megoldani, hogy a szoftveredet mire optimalizáld, pl. van-e HT vagy nincs, vagy befékezi-e a buszt a kis mag vagy sem....
A Zen5-féle megoldásnál majd meglátjuk, hogyan sikerül összerakni a rendszert, lesznek-e hasonló gubancok vagy sem.

#6986 Petykemano: Csak a Rembrandt nem hinném, hogy "elvinne" a lábán egy platform startot. :N Az még AM4-nél is csak egy erős középkategória lenne. Kéne mellé még valami, ami kicsit nagyobbat szól. :K

#6993 Pakmara: Pl. gyártási/tervezési költség optimalizálása. Az olcsóbb termékbe elég kevesebb periféria vezérlő/PCIe sáv, a drágábba viszont több kell, így pedig egy lapkával megoldják mindkét igény lefedését. Mint a processzoroknál, 8 magig 1 CCD-t, 8-16 között kettőt raknak rá.

[ Szerkesztve ]

(#6996) Petykemano


Petykemano
veterán

Na megindult a csirip...

"If this tweet gets 1 like we will ... ah nevermind, Ryzen 7000 launches 'this fall' 🙃"
[link]

"So Ryzen 7000 has two core chiplets 🤫"
[link]

AMD Ryzen 7000 desktop series to offer over 15% single-thread uplift, launch this fall

(Hát az a 15% elmarad a várakozástól... de ez sandbaggingnek tűnik, ha csak ősszel rajtol)


Nincs double substrate.
Csak sok kondenzátor.

Találgatunk, aztán majd úgyis kiderül..

(#6997) S_x96x_S válasza Petykemano (#6996) üzenetére


S_x96x_S
őstag

>> ...to offer over 15% single-thread uplift
> .. Hát az a 15% elmarad a várakozástól...

csak egy óvatos megfogalmazás ..
mert nagy különbség van az "up to" és az "over" között.

vagyis >= 15% a legrosszabb esetben is.
Az átlagot meg majd meglátjuk a valós tesztekből ..

és holnap délre minden kiderül ..

Mottó: "A verseny jó!"

(#6998) Petykemano válasza S_x96x_S (#6997) üzenetére


Petykemano
veterán

Igen, teljesen igazad van.
Upto vagy átlagot.szoktak mondani. Mert jobban hangzik. Ez meg from/over. Tehát leggyengébb ST javulás is 15%. Ebből persze lehet, hogy 10%-ot a frekvencia magyaráz.
De hát láttuk, milyen szórása volt a v-cache-nek is. Biztos lesz, ami lényegesen jobban reagál az L2$-re.
Ezen kívül a zen4 célja az avx512 volt. FP végrehajtásban lehet,.hogy nagyon parádés lesz.

Ezzel.együtt ahogy várható volt, elindult 15% keveslése.

Találgatunk, aztán majd úgyis kiderül..

(#7000) hokuszpk válasza Devid_81 (#6999) üzenetére


hokuszpk
nagyúr

Lehet bejön a 6Ghz singlecore peak tippem ? ;]

amugy ABU a videokartyasban epp most fejtegette, hogy ha erosen promozzak, akkor nem lesz jo.

Első AMD-m - a 65-ös - a seregben volt...

Copyright © 2000-2024 PROHARDVER Informatikai Kft.