Hirdetés

2024. június 28., péntek

Gyorskeresés

Hozzászólások

(#9451) hokuszpk válasza Petykemano (#9450) üzenetére


hokuszpk
nagyúr

a 14900K -val valo osszehasonlitasban az a trukk, hogy az "uj" Intel Baseline profilet hasznaltak a teszthez...

ettol fuggetlenul nem rosz ez ; de az az erzesem, hogy nem jatszottak ki minden kartyat ; szoval ezek a procik tudnának magasabb frekire menni, es ha az Intel uj architecturaja nagyot ugrik, akkor jöhet az XT sorozat...

az AM4 meg a socketek Windows XP -je :D

Első AMD-m - a 65-ös - a seregben volt...

(#9452) Petykemano válasza hokuszpk (#9451) üzenetére


Petykemano
veterán

Ó, de ravasz, ezt nem is néztem...
Mármint persze más szempontból korrekt, és az Intel tolta túl, csak hát a számok így nem egyértelműek.
Úgy rémlik egyébként nekem, hogy a baseline config nem volt annyira nagy hatással a játékokra: 2-3%
Merthogy játékok alatt viszonylag normális fogyasztása volt.

Szerintem meg a "szerény" frekvencia, ami talán a gyártéstechnológia következménye, velünk marad.
A Zen6 biztosan ezeket a low hanging fruitokat fogja leszedni, hogy N3-on ki lehet majd tömni picivel több regiszterrel, cache-sel, és 2-300Mhz-cel lehet magasabb frekvencia.

Lineárisan skálázódik a TDP a magok számával. Szerintem nincs itt már értelmesen kiaknázható tartalék.

Másrészt persze a TDP-t azért is kellhet alacsonyan tartani, mert a Qualcomm irányából épp a hatékonyság irányából fog jönni a támadás.

Találgatunk, aztán majd úgyis kiderül..

(#9453) hokuszpk válasza Petykemano (#9452) üzenetére


hokuszpk
nagyúr

"Úgy rémlik egyébként nekem, hogy a baseline config nem volt annyira nagy hatással a játékokra: 2-3%"

azert vannak kulonbsegek ; hirtelen nemtalálom, de valamelyik topicban összeakadtunk Albussal azon, hogy ket erosen kulonbozo tesztet találtunk ; ami az Igornal levo tablazat alapjan a Giga lapon a 125/188W "default" profilt jelentette ; az Asusnal meg a 253/253 "extreme" -t.

Első AMD-m - a 65-ös - a seregben volt...

(#9454) b.


b.
félisten

tesztkörnyezet:

"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)

(#9455) S_x96x_S válasza Petykemano (#9450) üzenetére


S_x96x_S
őstag

> Szóval ez a 16% megszokott, konzervatív.

És ebbe az AVX-512 is bele van számolva, amit nem minden program tud hasznosítani.
Ettől függetlenül én meg vagyok elégedve. :R
( habár nem is tettem túl nagyra az elvárásaimat )

----

Bár ez csak az IPC, ( egy cpu mag )
és ebbe
( a pletykákban említett )
hatékonyabb chiplet<-->chiplet kommunikáció ( Infinity Fabric ?) nem számít bele.
Viszont a 2db CCD közötti kommunikáció javítására nem találtam forrást
a mostani bejelentésben. ( vagy csak felületes voltam vagy félreértettem valamit )
Mindenesetre én várom a részleteket, mert bennem csak több lett a megválaszolatlan kérdés.

"There are also a couple of points within the Zen 5 architecture where AMD has doubled up on resources or performance. L2 to L1 memory bandwidth is one such example, giving the cache hierarchy a big bandwidth boost that should allow for faster data transfers within the individual CPU cores. AMD also claims better AI performance in inferencing and AVX-512 workloads. Notably, AMD's AVX-512 support on Zen 4 was executed using a 256-bit SIMD over 2 cycles, so this may be a sign that AMD has expanded their AVX-512 SIMDs to a full 512-bits wide in the Zen 5 architecture. (Update: This has since been confirmed by AMD. Zen 5 now has a full 512-bit wide SIMD for processing AVX-512 instructions)"

https://www.anandtech.com/show/21415/amd-unveils-ryzen-9000-cpus-for-desktop-zen-5-takes-center-stage-at-computex-2024

Mottó: "A verseny jó!"

(#9456) Petykemano válasza S_x96x_S (#9455) üzenetére


Petykemano
veterán

Én többet vártam.
Mike Clark ábrándos csodálata után... Persze a zen3-hoz képest tényleg csodálatosan gyors, de nem csillog olyan szépen a zen4-hez képest.
De nem is ez a lényeg. Hanem hogy arról volt szó, hogy durván szélesítik, meg a dual decoder, meg az L1d méretnövelése. Szóval én M1 momentumot reméltem.

Eddig mindig volt valami meglepi az egyébként tisztességes 10-13% körüli IPC emelkedés mellé. Zen2 esetén a magszám, Zen3 esetén a 8 magos CCX-ből származó játék teljesítmény növekedés, a Zen4 esetén az órajel. Itt az wunder-architektúrát vártam. Az előző mérföldkövekhez képest eddig úgy tűnik, nem hoz annyit. Persze az ár még sokat nyomhat a latba.
Meg lehet, hogy pár évig úgyis a tops fog eladni mindent.

Chiplet-chiplet kommunikáció vonatkozásában én se láttam eddig semmit. Talán mintha fclk növekedésről lett volna szó.

Találgatunk, aztán majd úgyis kiderül..

(#9457) S_x96x_S válasza Petykemano (#9456) üzenetére


S_x96x_S
őstag

> Én többet vártam.

biztos több mindent terveztek,
és elméletileg 2024 H1 -ben kellett volna kijönni az eredménnyel .. de ez van ..

> Persze az ár még sokat nyomhat a latba.

MLID legfrissebb videójába belenéztem
és éppen az árat emelte ki , amire az AMD-nek fókuszálni kellene .
( ha jól értettem azért, mert az Intel új CPU állítólag MultiCore-ban akár meg is verheti a Zen5-öt, és ráadásul TSMC 3nm -en készül ,
ÉS a 3nm - persze drágább mint a Zen5 -ös 5nm+4nm -es gyártása,

Persze az AMD válasza az Intelre - a ZEN5 +X3D lehet.
( És talán az újabb generációs X3D -vel kárpótolhatjuk a csalódásunkat. )

> Meg lehet, hogy pár évig úgyis a tops fog eladni mindent.

Viszont a desktopnál maradt az RDNA2 és nincs NPU.
( remélem a következő generációnál ezt orvosolják )
Remélem a "Turin AI" - chiplet - minél gyorsabban elérhető lesz Desktop-on is.

De amúgy a sima Turin - nem sikerült annyira rosszul ..

Az MI 325X bejelentése pedig mutatja, hogy vége a lazsálós korszakoknak .. elég erős verseny várható.
https://www.anandtech.com/show/21422/amd-instinct-mi325x-reveal-and-cdna-architecture-roadmap-computex

És ha az AMD megoldja az RDNA skálázást is ( mint a CDNA -nál) ,
akkor a játékoknál is egy új forradalmat látunk ...

Mottó: "A verseny jó!"

(#9458) hokuszpk válasza Petykemano (#9456) üzenetére


hokuszpk
nagyúr

"Eddig mindig volt valami meglepi az egyébként tisztességes 10-13% körüli IPC emelkedés mellé. "

én is többet vártam. 16 helyett kerek 20% -ot :D
az AMD ha jolláttam akkor DDR5-6000 mellett tesztelt ; viszont allitolag az I/O die siman hozza a 2400 -at, azazvagyis memoriabol a DDR5-7200 lesz az optimalis ; ami még rádobhat pár % teljesitmenyt.

Első AMD-m - a 65-ös - a seregben volt...

(#9459) Busterftw válasza Petykemano (#9456) üzenetére


Busterftw
veterán

Én is többet vártam, persze független tesztek előtt nem szoktam komoly ítéletet hozni.

Az én meglátásom szerint az a szituáció, hogy az AMD előtte az összes puskaporát és nagy áttörés már nem várható.
Ott volt nekik a jobb node, a chiplet design.

Ha desktopot nézünk, az Intel úgy vészelte át ezt az időszakot és tartotta a lépést, hogy ezekhez még nem nagyon nyúlt hozzá és még csak most fog.
Szóval nagyon kíváncsi vagyok mi van az AMD előtt a tervasztalon.

(#9460) b. válasza Petykemano (#9456) üzenetére


b.
félisten

Ez örök porbléma marad az AM- nél, a hype. De valójában egy amúgy is remek CPU családnál akkorát léptek előre hogy a konkurencia igazából a habokba sincs teljesítmény / energiahatékonyság terén. Szerintem nagyon jó lett ez így ahogy van, én nem vártam tőle többet sőt, túl is szárnyallja az elvárásaimat.

"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)

(#9461) hokuszpk válasza Busterftw (#9459) üzenetére


hokuszpk
nagyúr

perpill asztalra ez a teljesitmeny boven eleg ; amig a szoftveresek el nem inflálják ; de az még legalább 1-2 év. nekem ugytünik az AMD fókusz továbbra is a szerverpiacon van, mert onnan jön a nagyobb bevétel ; azt meg majd meglátjuk az Intel a TSMC 3nm -en mit gurit.

Első AMD-m - a 65-ös - a seregben volt...

(#9462) S_x96x_S


S_x96x_S
őstag

Ami még érdekes , az az, hogy miről nem volt semmi új hír.
pl.
- az MI300A -ról és az utódjairól.
- valamint a PCIe változatokról.
de a cikk[1] annyi infót összeszedett,
hogy azért dolgoznak ezeken is, csak most még nem volt mit bejelenteni.
[1] https://www.theregister.com/2024/06/03/amd_reveals_refreshed_mi325x_with/?page=2

Mottó: "A verseny jó!"

(#9463) Petykemano válasza S_x96x_S (#9457) üzenetére


Petykemano
veterán

> és éppen az árat emelte ki , amire az AMD-nek fókuszálni kellene .

Ha nincs titkos meglepi, akkor talán - igaza van MLiD-nek - helyes volna úgy árazni, hogy az 9600 (X nélkül) $250-on nyit és $300 lesz a hamar érkező (?) 9600X3D

Ez már csak azért is szükséges lehet, mert ahogy mondod az AMD MT teljesítmény hátrányba kerülhet, ezt pedig úgy tudja orvosolni, ha árban lejjebb csúsztatja a termékskálát.

Ahol meglepi lehet még az talán az energiahatékonyság.

> És talán az újabb generációs X3D -vel kárpótolhatjuk a csalódásunkat.

Tudom, hogy az L3$ bővítése a csökkenő határhasznosság elvébe ütközik, de esetleg lehetne az a meglepetés, hogy nem 1x64MB, hanem mondjuk 2x64MB kapacitást ad hozzá.

A Zen6 újítása elvileg az lesz, hogy a CCD-IOD kapcsolat cserélődik az magas frekvenciájú organikus szubsztráton kereszüli megoldásról valami alacsony késleltetésű szélesre.
Talán valami olyasmi is lesz, hogy a L3$, vagy annak bővítése megosztva, vagy L4$ formájában beköltözik a base die-ba. De a lényeg feltehetőleg az lehet, hogy az egyébként külön gyártott chipletekből 2-4-et össze lehessen kötni adatmegosztás céljából alacsony késleltetéssel

> Viszont a desktopnál maradt az RDNA2 és nincs NPU.

Az igazság az, hogy én épp ezért gondolkodom már inkább a Strix-ben. A Zen4 esetén tök jó volt, hogy végre bekerült a képet adni képes IGP.
Őszintén szólva nem tudom, hogy mik az eladási számok, így tévedhetek is, de ez és a mainstream GPU alja közötti tér szerintem kevéssé érdekes. GPU nélküli mobil gépek esetén (ide értve egy notebookot, minipc-t vagy kézikonzolt) persze érdekes, de tartok tőle, hogy a "csak adjon képet" típusú dekstop/mobil felhasználás és a dGPU-val rendelkező gamingre (is) használt felhasználás között ez a szegmens réteg csupán. Persze tévedhetek.

NA mindegy, szóval azt akartam mondani, hogy a Zen4-ben tök jó volt, hogy már nem kellett csak a kép miatt egy alacsonyabb teljesítményű és kvázi feleslegesen nagy IGP-t tartalmazó APU-ban gondolkodni.

A Granite ridge ebből a szempontból sem tűnik érdekes (innovatív) terméknek.
(Ebben persze számíthat, hogy számukra is a desktop piac a legkevésbé érdekes)

A Strix point sokkal érdekesebb az RDNA3.5-tel és az NPU-val, miközben az még a magszámot is emelte! A Strix Halo szintén érdekes, hogy mit fog tudni az a böhöm IGP-vel (és persze milyen áron...) A Strix halo esetén talán csak a 16 magos CPU fura. Én azért bízom benne, hogy ha ez chipletes, akkor 1 CCD elhagyható, ha monolitikus, akkor viszont a 16-ból 12 Zen5c. (még ha 2db CCX-ről van is szó.)

> Az MI 325X bejelentése pedig mutatja, hogy vége a lazsálós korszakoknak .. elég erős verseny várható.

Azért szerintem ez félig-meddig látványpékség.
Én nem hiszem, hogy a HBM3 => HBM3E csere olyan nagy feladatnak kéne lennie. Talán egy fokkal bonyolultabb, mint egy GPU esetén GDDR6 16mbps helyett 18.5mbps VRAM-mal szerelni, de lényegében csak az N6-on tervezett bázislapkát kell cserélni.

A fejlesztés szerintem ezzel végső soron nem lesz gyorsabb, ugyanúgy 2-3-4 év, míg valami elkészül, de az ebből termékké formált iterációk száma tényleg növekedhet.

Ez fogyasztói szemmel persze összességében jó lehet, hiszen a cégek azzal versenyezhetik le az áraikat, hogy sűrűbben kiadott termékiterácókkal sűrűbben licitálnak rá/alá egymásnak.

Találgatunk, aztán majd úgyis kiderül..

(#9464) Petykemano


Petykemano
veterán

Egyébként csökkent a base clock párszáz Mhz-cel. Ahol a TDP is csökkent, ott meg majdnem Ghz különbség van. Utóbbi persze nem teljesen ismeretlen, mert a 65W-os X nélküli Zen4-ek esetén is így volt.

De mi lehet az ok?
Nem lesz X nélküli változat?
Vagy az X nélküli változatok egyenesen 45W-os TDP-t kapnak? (vs Qualcomm?)
Vagy az X3D változatnak tartják vissza a teljesítményt, hogy ne legyen hátrányban MT esetén se?

Találgatunk, aztán majd úgyis kiderül..

(#9465) S_x96x_S válasza Busterftw (#9459) üzenetére


S_x96x_S
őstag

> Szóval nagyon kíváncsi vagyok mi van az AMD előtt a tervasztalon.

CPU területén azért jó behatárolt:

- a zen6-ban állítólag lesz már egy olyan avx-512 -es utasítás ami nem lesz támogatva később és a zen5-ben jelent meg.
- az Intel AMX kiterjesztés - ai szempontból igéretes lesz ( főleg akkor, hogyha az Intel elvégzi a szoftveres integráció nagy részét és az AMD-nek ezzel már nem lesz túl nagy dolga. )
- Speciális FP ( floating point) típusok támogatása CPU szinten ( FP4, FP6 ) - amelyek a HPC-s és az AI munkákban fontosak. ( pl. MI400A , MI500A esetén, hogyha a cpu és a CDNA ugyanazon az adattípuson akar dolgozni, akkor ez nagyon is fontos lesz! )
- és akkor ott van az Intel új AVX10 -es iránya,
de szerintem ezzel kapcsolatban az AMD még kivár:
az Intel speciális HW-res gyorsításait ( pl. QAT QuickAssist, ) ami majdnem olyan funkciót lát el, mint a KRAKEN a PS5-ben, valószínüleg az AMD is valami spéci chippel oldja meg. ( AIE? )

És a sötét ló:
- valószínűleg az AMD is dolgozik az ARM-es CPU-n és APU-ján.
én még AMD arm-es szerver cpu-t is elképzelhetőnek tartok.

De amúgy meg ez a régi MLID roadmap: ( 9 hónappal korábbról )

A zen5=Nirvana - hozta a 16% IPC-t ( a slide-on 10-15% szerepel )
Zen6 = Morpheus - utolsó oszlop. és itt csak 10% IPC szerepel, amiből talán lesz 11%-12%
de még új 32 CCD ( valószínüleg a TSMC 3nm lehetővé teszo )
és FP16 AI/ML támogatás

A ZEN5-nél már azért gondoltak a 3nm-e is, de 4nm lett belőle.


és a Zen5 = Nirvana .. vagyis elméletileg ez lett most bejelentve:

És év végére is lehet még meglepetés, nemcsak az X3D ..
- Ha elkészül a 16 magos zen5c CCD - akkor akár AM5-ben is megjelenhet.
- és ami meg érdekes lenne, hogyha a ZEN5C-re X3D cache-t is tudnának rakni.
De ehhez viszont már rendes szoftveres támogatás is kell a windows-ba és a Linux-ba a mert az már várhatóan 24 magos proci lesz ( 8x zen5 + 16x zen5c )

Mottó: "A verseny jó!"

(#9466) S_x96x_S válasza Petykemano (#9464) üzenetére


S_x96x_S
őstag

> Egyébként csökkent a base clock párszáz Mhz-cel.
> De mi lehet az ok?

Az új AVX-512 -re tippelek.

Lehet, hogyha fullosan minden mag kihajtja az új AVX-512 -öt,
akkor csak ennyit bír a rendszer, mert túlmelegszik.
És ha a base FREQ visszaesne az AVX-512 miatt,
akkor az eléggé összezavarná a fejlesztőket mint az Intelnél.
"Intel’s latest processors have advanced instructions (AVX-512) that may cause the core, or maybe the rest of the CPU to run slower because of how much power they use."
stack overflow: SIMD instructions lowering CPU frequency

és a ZEN5 sikerét is sokan ezen mérik majd.
( a tesztelők egyik fókusza ezen lesz ! )

Mottó: "A verseny jó!"

(#9467) Petykemano válasza S_x96x_S (#9465) üzenetére


Petykemano
veterán

> - Ha elkészül a 16 magos zen5c CCD - akkor akár AM5-ben is megjelenhet.

ha ezek a képek valósághűek [link] [link] akkor a forma alapján ítélve én kétlem, hogy ez megtörténne.

Viszont vajon miért tűnik úgy, mintha a Zen5c lapkák kaptak volna egy fedlapot, mint a Mi300?

Találgatunk, aztán majd úgyis kiderül..

(#9468) hahakocka


hahakocka
senior tag

Ez a Ryzen 9700x lesz lehet akkor a választásom a 2600x-ről váltás esetén.
Csak 65W ot eszik és elvileg közel lesz vagy egál a x3D s 7800x-el . Majd persze kiderül. De viszont jobb lesz (x3D seknél) content gyártásra és munkára is.

Sose értettem ezt a +2% ért hajrá 7200mhz-es ramok vételeket, kb a duplája ár arányban sokszor egy 5600 asnak vajon jobb is mondjuk 20-30% al tőle a teljesítmény ? Hát nem. :D Munkára persze azért más ott lehet számít még az is, s visszajön.

[ Szerkesztve ]

(#9469) HSM válasza S_x96x_S (#9466) üzenetére


HSM
félisten

Ha teljes terhelésen a hőmérséklet (vagy TDP limit) miatt vesszi vissza az órajelet, az szvsz egyáltalán nem probléma. Pl. a Haswell Intelek is ezt csinálták a sima AVX2 alatt, de úgy is sokkal gyorsabbak maradtak, mint AVX1-el vagy anélkül.

Intelnél korábban az AVX512-vel az volt a probléma, hogy lassú módváltás kellett az AVX512 utasításokhoz, és drasztikusan csökkent az elérhatő órajel csupán a mód aktiválásakor. Tehát ha valahol volt néhány kósza AVX512 utasítás, az egész CPU-t befékezte, de a megnyert sebesség nem volt ezzel arányban.
Van róla egy halomnyi cikk főleg SSL optimalizáció terén, belinkelem az első releváns keresési eredményt, amit találtam: [link] . :)
Tehát nem a megtermelt plusz hő vagy fogyasztás volt a gond, hanem hogy csupán néhány utasítás jelenléte is már jelentősen befékezte a CPU-t.

[ Szerkesztve ]

(#9470) Busterftw válasza S_x96x_S (#9465) üzenetére


Busterftw
veterán

Persze, jol behatarolt, tudjuk hogy jon az ZEN 6, ZEN 7 esatobbi.
Minden amit alatta a dian latsz, hozzajarul ahhoz a 10-20-30% IPC-hez.

Epp ezt mondom, reszelgetik a meglevot, TSMC oldalon ott a mar tomeggyartasban levo 3nm, 2nm sok mindent nem fog hozni, utana meg meg kerdes, de szinten nem varhato nagy ugras. Chiplet is marad kozep-hosszutavon.

(#9471) S_x96x_S válasza HSM (#9469) üzenetére


S_x96x_S
őstag

azért a base órajelet illene tartani bármilyen utasítás esetén.

> "Tehát nem a megtermelt plusz hő vagy fogyasztás volt a gond,
> hanem hogy csupán néhány utasítás jelenléte is már jelentősen befékezte a CPU-t."

az extrém hőtermelés volt a gyökér ok ( root cause ),
ami miatt az Intel beépítette ezt a féket - mint amolyan algoritmikus hőszabályozást.

AVX-512 :
"However, some of these instructions use a lot of power and generate a lot of heat. To keep power usage within bounds, Intel reduces the frequency of the cores dynamically. This frequency reduction (throttling) happens in any case when the processor uses too much power or becomes too hot. However, there are also deterministic frequency reductions based specifically on which instructions you use and on how many cores are active (downclocking). Indeed, when any 512-bit instruction is used, there is a moderate reduction in speed, and if a core uses the heaviest of these instructions in a sustained way, the core may run much slower. Furthermore, the slowdown is usually worse when more cores use these new instructions. In the worst case, you might be running at half the advertised frequency and thus your whole application could run slower. On this basis, some engineers have recommended that we disable AVX-512 instructions default on our servers."

via https://lemire.me/blog/2018/09/07/avx-512-when-and-how-to-use-these-new-instructions/

vagy másképpen :

"n the 'hardest' instructions, Intel uses special turbo values for AVX-512, as due to the way these instructions are processed, more heat is generated on chip. The chip has to balance frequency and power draw, so the AVX-512 data comes in at a lower frequency in order to keep the turbo in check."

( 2018, Anandtech )

Mottó: "A verseny jó!"

(#9472) HSM válasza S_x96x_S (#9471) üzenetére


HSM
félisten

"az extrém hőtermelés volt a gyökér ok ( root cause ),"
Nem, legalábbis nem önmagában. Semmi gond nem lett volna belőle, ha nem áll fenn a másik két körülmény:
- a maximális turbó Inteleknél az összes magra limit, tudtommal nem tudnak külön órajelen járni, mint a Ryzenek magjai, ezért ha egy magot be kell fékezni, akkor a többit is
- a "lassú" üzemmódváltás a kód AVX512-es és más részei között

Érdekes lenne utánanézni, A Ryzen 7000-esek esetén volt-e gond az AVX512 miatti nagyobb melegedés miatt, de én nem olvastam hasonló panaszokat, mint Intelnél.

(#9473) Petykemano


Petykemano
veterán

Van itt egy kis gaming adat [link]
9900X + 7900XTX
Avatar valami
1080p high
Átlag 223 fps

Találgatunk, aztán majd úgyis kiderül..

(#9474) S_x96x_S válasza HSM (#9472) üzenetére


S_x96x_S
őstag

a gyakorlatban mindenkit úgyis az fog érdekelni,
hogy lesz -e negativ turbó - a "base órajelhez képest" - normál hűtésnél.
( és hogy ez throttling vagy más okból következik be, az a felhasználók számára már kevésbé fontos. )

de ezt alacsonyabb a base órajellel is lehet kezelni,
és akkor maximum nem fog turbózni az órajel ..

> ...A Ryzen 7000-esek esetén volt-e gond az AVX512 miatti nagyobb melegedés miatt,

Az újabb Inteleken és a Zen4-en nincs ilyen gond

Mottó: "A verseny jó!"

(#9475) hokuszpk válasza S_x96x_S (#9474) üzenetére


hokuszpk
nagyúr

"Az újabb Inteleken és a Zen4-en nincs ilyen gond "

mert az ujabb Intelekbol kivettek az AVX512 -t ;]

Első AMD-m - a 65-ös - a seregben volt...

(#9476) Alogonomus válasza Petykemano (#9473) üzenetére


Alogonomus
őstag

Na igen, azt a 223 fps-t nem is igazán tudtam hova tenni.

Az csak az egyik, hogy látványosan nem hajtotta ki magát a 7900 XTX (átlag 63%), de:
- amennyiben a kevésbé valószínű forgatókönyv szerint frame gen nélkül érte ezt el, akkor az Intel "csomagolhat is", mert a Zen5 és az RDNA3 rettentő jó párost alkotnak, a 7800 X3D is csak 141 fps-re képes 85% GPU használat mellett.
- amennyiben pedig a sokkal valószínűbb forgatókönyv alapján frame gen segítségével érte ezt el, akkor a 9900X nagyon visszafogja a 7900 XTX-et, mivel nálam ugyanezen a beállításon átlagosan 87% GPU használattal 277 fps jön ki, vagyis a legolcsóbb - lényegében már előző generációs - X3D is 24%-kal potensebb, mint a 9900X, ami viszont bőven túl nagy különbségnek tűnik, ha a régi Zen4 X3D, vagy az új "sima" Zen5 között kell majd valakinek választania.

(#9477) S_x96x_S válasza hokuszpk (#9475) üzenetére


S_x96x_S
őstag

A P+E miatt vették ki az AVX-512 az Intel consumer cpu-kból,

de a szerver fronton a Sapphire és az Emerald -nak elég jó az AVX-512 -es implementációja.
" The difference in peak frequency with AVX-512 enabled and disabled was minimal. With it on, the Xeon Platinum 8592+ hit 2.95 GHz on all cores compared to 3.01 GHz when AVX-512 was off. The 64-core Emerald Rapids chip hit the 3.9 GHz boost clock regardless of whether AVX-512 was on or off."

sőt ... annyira jó, hogy a Microsoft(Azure) - az AMD's MI300X - mellé
nem EPYC-et választott, hanem Sapphire Rapids -ot.

"Support for a wide spread of AVX-512 instructions is a primary selling point of Emerald Rapids. Although the CPU loses out to AMD's 4th Generation EPYC Genoa chip with 96 cores in raw performance, as seen in our Emerald Rapids review, AVX instructions can change the dynamic between Intel and AMD's server CPUs, especially for AI. It's one of the probable reasons Microsoft chose last-generation Sapphire Rapids chips over EPYC to pair with AMD's MI300X GPUs."

( forrás )

úgyhogy az AVX-512 teljesítménye
szerver fronton sokkal fontosabb mint desktop-on
és a ZEN5 fejlesztési célja így jobban érthető is,

Mottó: "A verseny jó!"

(#9478) HSM válasza S_x96x_S (#9474) üzenetére


HSM
félisten

Engem a Haswell-en egyáltalán nem zavart (i5-4690K), hogy AVX2-vel kb. 10%-al alacsonyabb órajelen sikerült csak meghűtenem, mint anélkül, miközben kb dupla tempót mértem rajta. :C
Értelmesebb emberek remélhetőleg a Zen5-nél sem csak az órajelet és fogyasztást fogják nézni AVX512-vel, hanem az elért tempót is.

(#9479) S_x96x_S válasza S_x96x_S (#9446) üzenetére


S_x96x_S
őstag

- AMD ZEN5 +16 IPC
- Lunar Lake: Up to 68% IPC gain for E-cores, 14% IPC gain for P-Cores

"Intel’s Lunar Lake will come with four P-cores and four E-cores in the top-tier SKU. "

mintha CPU terén lenne elég tartalék a Strix Point-ban,
habár a Zen 5c teljesítménye még nem ismert.

LunarLake : 4P+4E
Ryzen™ AI 9 HX 370 : 4x Zen 5 , 8x Zen 5c

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#9480) hokuszpk válasza S_x96x_S (#9479) üzenetére


hokuszpk
nagyúr

ekkora ugrassal nem lesz erosebb az "E" core, mint a "P" ???

Első AMD-m - a 65-ös - a seregben volt...

(#9481) hokuszpk válasza S_x96x_S (#9479) üzenetére


hokuszpk
nagyúr

vegre volt idom megnezni egy videot ; aszondja a tag, hogy az "E" core ipcjet az Intel a Meteor LP-E magjahoz ; tehat nem az ott "E" core -nak nevezett "középső" maghoz képest viszonyitva adja meg. Namost így már nemtűnik annyira méregzsáknak.

Első AMD-m - a 65-ös - a seregben volt...

(#9482) S_x96x_S


S_x96x_S
őstag

An Interview with AMD CEO Lisa Su About Solving Hard Problems
https://stratechery.com/2024/an-interview-with-amd-ceo-lisa-su-about-solving-hard-problems/
( Lessons From IBM | The AMD Turnaround | AI | Competing With Nvidia )

sok sok diplomatikus válasz ..

Q:Is there ever a world where AMD fabs with Intel?
LS: I would say that we’re very happy with our manufacturing relationships right now.

Q:It does occur to me, Intel, AMD — it’s one of the greatest rivalries in the history of technology from basically the very beginning. Is there a bit though where when you step back, you want to step back in these conversations, there is a bit where you are in it together, because the real enemy is Arm?
LS: You make it sound like Arm is an enemy, I don’t consider ARM an enemy, so let me start with that. We use Arm all over our product portfolio. I consider the fact that we think x86 is a phenomenal architecture, and the capabilities are there, but please don’t think of AMD as an x86 company, we are a computing company, and we will use the right compute engine for the right workload.
As it relates to how I think about — if you look at the semiconductor industry today, there are places where we compete, and then there are places where we partner. So on your Intel point, we do compete in certain areas, but we also partner in certain areas. Intel is part of the UALink Consortium, they’re part of the Ultra Ethernet Consortium.

---

Mottó: "A verseny jó!"

(#9483) Petykemano


Petykemano
veterán

A Strix első eredményei elég lehangolóak.
8 helyett 12 maggal, ami átlag 16%-os IPC növekedést ad mindössze 20%-kal jobb MT teljesítmény.
12 helyett 16 CU és csupán 40%-kal jobb teljesítmény.

Találgatunk, aztán majd úgyis kiderül..

(#9484) Petykemano válasza Petykemano (#9483) üzenetére


Petykemano
veterán

Itt 12.9% ST és 25% MT [link]

Találgatunk, aztán majd úgyis kiderül..

(#9485) HSM válasza Petykemano (#9484) üzenetére


HSM
félisten

CPU-Z... :F

(#9486) S_x96x_S válasza Petykemano (#9484) üzenetére


S_x96x_S
őstag

> Itt 12.9% ST és 25% MT [link]

Egy 54W-os Minis Forum 790 Pro (mini-pc) - 7940HS -el lett hasonlítva,
egy ki tudja milyen Watt-on [ 15W - 54W ] , Freq-n és üzemmódban futó teszt CPU.

és a 8db zen5c magok biztos nem olyan erősek mint a sima zen5 -ös magok.
és alacsonyabb FreQ -n is működhetnek, amire érzékeny a cpu-z.

Mottó: "A verseny jó!"

(#9487) Petykemano válasza S_x96x_S (#9486) üzenetére


Petykemano
veterán

Szerintem a c.magok.(kombinált) használatának mögöttes gondolata épp az, hogy ilyen (egy magra nézve) alacsony TDP keret mellett valószínűtlen, hogy MT terhelés esetén a magok elérnék azt a frekvenciát, amit egyenként terhelve elérhetnének, ennélfogva a magok többségét felesleges erre felkészíteni, ennem tranzisztor (inkább waferméret) költsége megspórolható. Tehát korlátozott tdp és MT esetén nem kéne, hogy egy c mag gyengébb legyen.

Pont az ellenkezője lenne a cél.

De talán ezek még nem végleges eredmények, így nem biztos, hogy konklúziót le lehet vonni belőlük.

Találgatunk, aztán majd úgyis kiderül..

(#9488) S_x96x_S válasza Petykemano (#9487) üzenetére


S_x96x_S
őstag

a zen4c -nél elég érdekes a skálázás, a zen4c magok max 3.731GHz -re mennek fel.

"In the case of the Ryzen 5 8500G, the Zen 4 cores all reported a 5.076GHz frequency while the Zen 4C cores were at 3.731GHz."

persze szoftver ütemezési probléma is lehet,
mert a 2x Zen4, 1x zen4c ( felülről a 4. eredmény ) elég furcsa egyes programoknál.

Amúgy elég érdekes a teszt:

- 1 x Zen 4
- 1 x Zen 4, 1 x Zen 4C
- 2 x Zen 4
- 2 x Zen 4, 1 x Zen 4C
- 2 x Zen 4, 2 x Zen 4C
- 2 x Zen 4, 3 x Zen 4C
- 2 x Zen 4, 4 x Zen 4C

AMD Zen 4 vs. Zen 4C Performance, Zen 4C Core Scaling With Ryzen 5 8500G

és PowerSave módban volt a Linux ..

[ Szerkesztve ]

Mottó: "A verseny jó!"

(#9489) S_x96x_S


S_x96x_S
őstag

AMD mobil roadmap.
a Clevo -nál nem lesz 2024-ben Strix Point -os konfig.

( via https://videocardz.com/newz/clevos-cpu-laptop-roadmap-leaked-intel-arrow-lake-hx-to-compete-with-amd-fire-range-x3d-skus-in-2025 )

Mottó: "A verseny jó!"

(#9490) Busterftw válasza S_x96x_S (#9489) üzenetére


Busterftw
veterán

Valószínűleg a szokásos, nincs mindenkinek launchkor elég.

(#9491) awexco válasza S_x96x_S (#9488) üzenetére


awexco
őstag

Mi a méret különbség zen4 és zen4c közt ?

mert a teljesitmény 50-60% így első ránézésre .
fogyasztást nem nagyon néztem . Illetve igy össze se lehet hasonlítani .

I5-6600K + rx5700xt + LG 24GM77

(#9492) hokuszpk válasza awexco (#9491) üzenetére


hokuszpk
nagyúr

a Zen4c -ben kevesebb ( fele ) a cache, es a "sűrű" libraryval van tervezve ; ezert kisebb orajelet tud.

Első AMD-m - a 65-ös - a seregben volt...

(#9493) S_x96x_S


S_x96x_S
őstag

Lehet, hogy 4 különböző ZEN5 verzió is lehet ?

"My wild guess: What if the transistor density and the FPU port size are independent for the #AMD #Zen5? This would mean that there will be not 2 but 4 different Zen5 versions:""

https://x.com/InstLatX64/status/1800132652651159643

-------------

( 2023-nov-18)

How many different variants of Zen5 will they make? 😵‍💫
Already leaked:
Zen5 FP-512 on N4P (Turin Classic)
Zen5 FP-256 on N4P (Strix Point?)
Zen5c on N4P (Strix Point)
Zen5c on N3B (Turin Dense)
Zen5c on SF4(P?) (Sonoma Valley)
https://x.com/_wildc/status/1725865353748647988

Mottó: "A verseny jó!"

(#9495) Petykemano válasza Devid_81 (#9494) üzenetére


Petykemano
veterán

Azért érdekelne, hogy vajon itt is megint mi történt. Kicsit azért olyan, mintha CPU-ban is behúztak volna - ugyanabban az időszakban - egy RDNA3-at.
Az időszak, amelynek azt tulajdonítajuk, hogy GPU fejlesztésről erőforrás lett átcsoportosítva az AI/CDNA irányába talán azért lehet érdekes és meghatározó, mert a Mi300A formájában CPU is képviselteti magát.

1-2 évvel a kiadás előtt még biztosan lehet döntéseket hozni, hogy N3-on gyártunk vagy N4-en, utóbbi esetben bizonyára meg kell ejteni néhány nyesegetést , amivel energiát és költséget lehet nyerni néhány százalék teljesítményért.
Plauzibilis lenne azt gondolni, hogy e kettő közül az AMD valóban választott és utóbbival kisebb lépést tett ugyan előre, amivel hát sajnos előáll egy ilyen helyzet, hogy az ógeneráció X3D modellje sok esetben versenyképes marad, de legalább a termék olcsón, nagyobb mennyiségben és/vagy hamarabb is hozzáférhető lesz. Kicsit persze ott kilóg a lóláb, hogy nem érzem azt, hogy lerövidült volna ettől a termékciklus. Bár picit rövidebb, mint két év telt el.
Mindenesetre azt mondják, hogy az AMD 2 évente átlag 15%-os IPC növekedésével leszakadó pályán halad.

Az is biztos benne van a pakliban, hogy a fő célpiac továbbra sem a gaming. A szerverpiacon pedig a 15% átlagos javulás és az AVX512 még annál is jobb javulása pedig biztosan fontos tényezők nem is beszélve a magszám növelésről. A selejtet le kell dobni a desktopra, de hát hogy az milyen az már némileg másodlagos. vagyis a notebook/mobil piac mellett harmadlagos. A mobil piacon meg tartok tőle, hogy legalább pár évig a tops át fogja venni az eladási pont szerepet.

Mindenesetre azt bármikor megtehetik, hogy ráengedik a piacra a 9000X3D-t is. De ezzel valószínűleg be fogják várni az Arrow Lake-t.

Én továbbra is picit csalódott vagyok. Nem önmagában a remélt teljesítmény miatt, hanem amikor ez szóba kerül, mindig beugrik Mike Clark arca, ahogy becsukja a szemét és fú de szeretne 5 évvel később felébredni és megvenni a Zen5-t. De ahhoz képest meg nem akkora durranás. Ahhoz képest, hogy a Zen2-ről és a Zen3-ról nem ámuldozott így senki, pedig ezt az előrelépést azok is hozták.

A bejelentés előtt gyakran olvastam abban a kontextusban, hogy ez az AMD Firestorm momentuma. És hát a dual dekóder megjött ugyan, ami a rákfenéjének tűnt az x86 szélesítésének. De elgondolkodtam, hogy hol az ahhoz "tartozó" a 128-192kb L1$?
Nekem ez azt üzeni, hogy a Zen5 semmiképpen nem egy olyasfajta innováció, amint amit az Apple csinált. Jellegében sokkal inkább a Zen3-ra hasonlít. Újratervezés, de nem formabontó, innovatív megoldásokkal, hanem iteratív elképzelések hatékony implementálásával.

Találgatunk, aztán majd úgyis kiderül..

(#9496) S_x96x_S válasza Petykemano (#9495) üzenetére


S_x96x_S
őstag

Az eredeti TomsHW -es cikk bővebb;

Nyilvánvaló, hogy az X3D +30% teljesítményét csak egy +16% IPC nem fogja leelőzni,
de állítólag elég jól megközelíti, valószínüleg a jobb boost miatt is.
Persze nem mindenkinek éri meg upgradelni a zen4-ről.

(gépi magyarítással)
"""
....

Habár a standard Ryzen modellek közelebb lesznek az előző generációs X3D chipekhez, Woligroski azt is elárulta, hogy a következő generációs X3D chipek 3D V-Cache implementációja jelentős fejlesztéseket fog mutatni.
„Ami az X3D-t illeti, teljes mértékben elkötelezettek vagyunk mellette. Valójában néhány igazán izgalmas frissítést készítünk elő az X3D-hez. Tehát folyamatosan fejlesztjük, nem csak újrahasznosítjuk” – mondta Woligroski.

A részleteket még nem ismerjük, de az AMD több lépést is tehet a 3D V-Cache javítása érdekében. Például két generáció óta az AMD L3 cache chipletje a 7 nm-es csomópont sűrűség-optimalizált verzióját használja. Ha áttérnének egy újabb gyártástechnológiára, mint például a 6 nm-es vagy akár az 5 nm-es, az lehetővé tenné az AMD számára, hogy még több L3 cache kapacitást zsúfoljon be.

Az L3 chiplet szintén a CPU lapkára kerül, ami termikus kihívásokat jelent, és csökkent teljesítményhez vezethet néhány standard produktivitási munkafolyamatban. Egy újabb, vékonyabb die dizájn lehetővé tenné a vállalat számára, hogy csökkentse az L3 chiplet termikus többletterhelését, így az X3D chip standard munkában hasonlóan teljesítene, mint egy normál, nem-X3D modell.

Ha az AMD megoldja a termikus korlátokat, akár mindkét CPU die-ra helyezhet L3 cache-t. A jelenlegi 12-magos 7900X3D és 16-magos 7950X3D csak az egyik CCD chipleten tartalmaz cache-t. Ez lehetővé teszi, hogy a másik chiplet magasabb boost órajeleket érjen el, de az extra cache megduplázása, miközben a magasabb órajeleket megtartják, potenciálisan még jobb lenne. Természetesen a költségek döntő tényezők, mivel az X3D technológia prémium áron érkezik.

Az AMD második generációs 3D V-Cache-je javított az első generáción azáltal, hogy növelte az L3 chiplet adatátviteli sebességét 2 TB/s-ról 2,5 TB/s-ra, de még mindig ugyanazt a hibrid kötési megközelítést alkalmazta ugyanazzal a 9 mikronos TSV osztással, mint az előző generáció. Az osztás rendkívül fontos, mivel méri az L3 chipletet a CPU die-hoz csatlakoztató TSV-k sűrűségét, és egy kisebb osztásra (a TSMC jelenleg 6 mikronos SoIC-X osztásokat kínál) való áttérés lehetővé tenné az AMD számára, hogy több kapcsolatot zsúfoljon be ugyanabba a területbe, így nagyobb mértékben javítva a sávszélességet és a teljesítményt.

Az AMD további L2 cache-t is beépíthetne a chipletbe, de a mai technológia állása alapján nem világos, hogy ez lehetséges-e. Nemrég beszéltem Sam Naffzigerrel, az AMD senior alelnökével, vállalati munkatársával és termék technológiai építészével, és megkérdeztem, hogy az AMD fontolóra veszi-e az L1 és L2 cache-ek rétegezését.

„Abszolút, ha finomabb szemcséjű 3D interkonnektre jutunk. Jelenleg 9 mikronos TSV osztásoknál tartunk. Ahogy lefelé haladunk, mondjuk 6, 3, 2 mikronos és még alacsonyabb értékekhez, a partíciózás szintje sokkal finomabb lehet” – mondta Nafziger. (Érdemes megjegyezni, hogy nem határozta meg az L2 cache-hez szükséges specifikus osztást, így nem világos, hogy ez már lehetséges-e.) Az AMD azt is fontolgatja, hogy nagyobb CPU regiszter fájlokat adjon a chipletekhez, de Nafziger szerint a mai hibrid kötési osztások nem támogatják a szükséges sávszélességet (a technológia azonban szerepel az imec és a foundry útiterveiben).

Ne becsüld alá a Ryzen 9000-et

Sokan meglepődtek, hogy az AMD új Ryzen 9000 chipjei az előző generációs modellekkel megegyező mag- és cache-kapacitásokkal rendelkeznek. A boost frekvenciák is változatlanok maradnak néhány modellnél, míg másoknál csak enyhe, 100 MHz-es javulást tapasztalhatunk. Az AMD jelentősen csökkentette az alap órajeleket akár 700 MHz-el is, ami hozzájárult a TDP 40%-os csökkenéséhez. Azonban a 16%-os IPC növekedés és a megduplázott L1 és L2 adatátviteli sávszélesség, valamint egyéb finomítások jelentős generációs előrelépéseket eredményeznek, amelyek az AMD szerint érdemessé teszik a frissítést.

Néhány fejlesztés nem annyira nyilvánvaló a specifikációs lapon. David McAfee, az AMD Corporate VP-je és a Client Channel Business általános igazgatója, a Computex előtti sajtótájékoztatón elmondta, hogy a Ryzen 9000 jobban tartja a boost frekvenciát, ami azt jelenti, hogy hosszabb ideig marad a boost frekvencián, mint az előző generációs modellek:

"Szerintem a másik dolog, amit megemlítenék, az a frekvencia rezidencia, annak ellenére, hogy az Fmax (maximális frekvencia) nem igazán változott," mondta McAfee. "A dobozon szereplő adatok szerint a frekvencia rezidencia, a fedél és a termikus tervezés hatékonysága a 9000-es generációban növeli a hatékony frekvenciát az előző generációhoz képest. Így valóban egy összességében pozitív eredményt látunk, mivel a processzor a Zen 5 architektúrával gyorsabban fut, mint a Zen 4."

"A nap végén több teljesítményt nyújtunk anélkül, hogy növelnénk a fogyasztást, és a nap végén több teljesítményt nyújtunk anélkül, hogy növelnénk a hőt. Végül pedig egy nem-X3D chipet nagyon közel hoztunk egy X3D chiphez játék terén," mondta Wologroski.
"Mindezek a dolgok jelentős különbségek a korábbi kis lépésekhez és bevezetésekhez képest. Visszaveszünk a TDP-ből, mert kiderült, hogy a nyolc magunk annyira jó, hogy nincs szükség magasabb TDP-re, így szerintem ez egy elég éles összehasonlítás," zárta le.
Természetesen a bizonyíték a szállított szilíciumban rejlik. A Ryzen 9000 chipek júliusban kerülnek forgalomba, és akkor majd alapos benchmark teszteknek vetjük alá őket.

"""

Mottó: "A verseny jó!"

(#9497) S_x96x_S válasza Petykemano (#9495) üzenetére


S_x96x_S
őstag

> Mindenesetre azt bármikor megtehetik, hogy ráengedik a piacra a 9000X3D-t is.
> De ezzel valószínűleg be fogják várni az Arrow Lake-t.

9000X3D: talán 2024 szeptember
( de lehet, hogy akkor csak a bejelentés lesz meg ;
de az optimisták szerint akkor már kapható is lesz. )

"""
Our source on the Computex show floor tells us AMD plans to launch 9000X3D processors in September. This matches the staggered release of X870E motherboards that we anticipate will arrive the same month. There’s no hard indication of which CPUs will arrive first, but an educated guess from historical releases suggests it’ll likely start with Ryzen 9 9950X3D and possibly Ryzen 9 9900X3D.
https://www.club386.com/amds-next-gen-x3d-cpus-target-september-release/
"

A "Hot Chips" konferencia - August 25 to 27, 2024 - lesz;
és szerintem ez előtt be kell jelentenie az AMD -nek az X3D-t, hogyha szeptemberben tényleg árulni akarja.
és a Hot Chips-en fedig fel a Zen5 részleteit is.
"AMD Next Generation “Zen 5” Core" by Brad Cohen and Mike Clark, AMD

Év végén nem fogunk unatkozni, mert az Intel és a Qualcomm izgalmassá teszi a versenyt.
Jövőre pedig beszáll a versenybe az nVidia és sok más cég is.

Mottó: "A verseny jó!"

(#9498) S_x96x_S


S_x96x_S
őstag

A következő pár év a rendszer összeköttetésekben lesz kiemelkedő
( PCIe 7.0 ; Infinity Fabric ; UALink , CXL, UCIe , .. )
és nem a csomópontok erősségében.

és ennek a lefelé skálázása - a chiplet-chiplet kommunikáció
ami az MI300A -ban megvalósult.

és a kapcsolódó hir:
Synopsys Unveils Industry’s First PCIe 7.0 IP Solution: Up To 512 GB/s Data Rate
https://wccftech.com/synopsys-unveils-industrys-first-pcie-7-0-ip-solution-up-to-512-gb-s-data-rate/

Amúgy szerintem jövőre jönnek a PCIe Gen6 -os alaplapok és CPU-k.

Mottó: "A verseny jó!"

(#9499) S_x96x_S


S_x96x_S
őstag

(#9500) paprobert válasza Petykemano (#9495) üzenetére


paprobert
senior tag

Van rá esély, hogy menet közben változott a terv, mert 5 éve túl szépet firkantott a rajzlapra Mike, hogy igaz legyen.

De a gaming teljesítményt hiányolni egy szolidabb magszélesítés után, szerintem nem helyes elvárás.

Olvasva a híreszteléseket a Zen5 olyan lehet, kb. mint a Rocket Lake volt. Nem lépett gyártástech-et, szélesedett, de nem eleget, latencyproblémás volt, és ezzel csak egált tudott az aktuális Skylake-hez képest.
Valami hasonló lehet itt is.*

Bár modern utasításokat alkalmazó játékokban én előrelépést várok.
Tegyük fel, a kora 2000-res években írt motorokban kikap, valamint a cache spilloveres motorokban az X3D ellép. Naés? Minden másban oda tud verni.

*Látni kell a teszteket az objektív értékeléshez, mert jelenleg félinformációkból építünk teóriákat. :)

[ Szerkesztve ]

640 KB mindenre elég. - Steve Jobs

Copyright © 2000-2024 PROHARDVER Informatikai Kft.