- D1Rect: Nagy "hülyétkapokazapróktól" topik
- bitpork: Augusztus 2- szombat jelen állás szerint.
- zebra_hun: Hűthető e kulturáltan a Raptor Lake léghűtővel a kánikulában?
- Luck Dragon: Asszociációs játék. :)
- eBay-es kütyük kis pénzért
- sziku69: Fűzzük össze a szavakat :)
- Geri Bátyó: B550 szűk keresztmetszet, de mi és miért?
- Yutani: Yutani Retró Hangkártyái: AdMOS AdWave 32
- user2: Kia Ceed Gold 160 1.5 T-GDI MY2024
- Kempingezés és sátrazás
Új hozzászólás Aktív témák
-
S_x96x_S
addikt
gyönyörűség ..
végre egy normális alaplap - ahol már kielégő a PCIe x16 slotok száma! ( 7 ! )WRX80 chipset [128 PCIe 4.0 Lanes, 8x DDR4 Memory, Socket sWRX8]
+ AMD Ryzen Threadripper PRO 3000
Gigabyte WRX80 SU8 with 8-channel memory for sWRX8 CPUs
https://videocardz.com/newz/gigabyte-wrx80-su8-motherboard-for-ryzen-threadripper-pro-pictured -
S_x96x_S
addikt
AMD AOCC 2.3 Squeezing Out Extra Performance For EPYC Over GCC 10, Clang 11
https://www.phoronix.com/scan.php?page=article&item=amd-aocc-23&num=1Aki szerveres környezetben dolgozik Epyc -el ,
annak lassan érdemes lesz újra fordítani a kódokat AOCC -al
de ami a lényeg, hogy még most kezdik feltuningolni
ZEN-es optimalizációs okosságokkal a fordítóprogramokat.vagyis a ZEN-nek az idő jót tesz .. egyre több teljesítményt préselnek ki belőle ...
az Intel ( régi architektúrájának ) pedig az újabb és újabb biztonsági rések "betesznek"vagyis az én ökölszabályom: aktuális benchmark eredményeknél
- ZEN-nél adj hozzá +3% -ot ;
- az Intel-nél meg vonj le -3%-ot ..
kb ez lesz a várható benchmark elmozdulás 1-2 év múlva a most beszerzett hardvereknél.
( persze aki csak 1 éves távra néz és mindig a legjobbra vált, azokra ez nem vonatkozik)összesített grafikon:
és egy PostgreSQL:
-
hokuszpk
nagyúr
válasz
Petykemano #4495 üzenetére
na varjunk, igy este ehgyomorra ujraszamolom
mondjuk Apple mar lement 5nm -re, NV elment a Samuhoz a 8nm -re, AMD-n kivul ki maradt 7-en olyan nagy megrendelo, aki diszkontot kap ?
Lehet jon az Intel bergyartatni, es ralicitalt mindenkire is... -
Igen, valami ilyesminek én is örültem volna.
Ha már IGP és 720p, lehet ki is kéne próbálnom a CP 2077-et (bár ezért nem veszem meg, majd pár év múlva akciósan).
AMD's Vega 11 running on a Ryzen 5 2400G reaches (barely) playable levels. It's nowhere near powerful enough to handle 1080p at medium quality, but 720p at minimum quality averages 33 fps. The CPU most likely is struggling a bit, leading to minimums of 24 fps, but you could play Cyberpunk 2077 this way in a pinch. We also enabled FidelityFX CAS with 75 percent static scaling, which boosted the average fps to 43 (but minimums are still only 26 fps).
(via) -
-
Petykemano
veterán
válasz
hokuszpk #4494 üzenetére
szerintem valami olyasmi lehetett eddig, hogy nem, vagy nem csak a per-wafer ár számított az ajánlatban, hanem a teljes ajánlati összeg, ami ugye a per-wafer ár és a volumen szorzata.
Az árazás célja nem csak a maximális wafer ár elérése lehetett, hanem az, vagy az is, hogy a gyártókapacitás maximálisan legyen kihasználva.
Tehát ha volt 12000 wpm szabad kapacitás egy időszakra és jött egy ajánlat $10000/w és 5000wpm volumennel és egy $8000/w 10000wpm volumennel, akkor második ajánlatot fogadták el.Nyilván azt nem tudjuk, hogy működött-e olyan alkudozás, hogy az elsőnek odaadták amit kért, a másodiknak meg megmondták, hogy bocsi, de csak 7000wpm kapacitás van. Az ember azt gondolná, hogy igen, de ha az ajánlattevőnek pont annyi kell, mert az ő megrendelése is annyit tenne szükségessé és nem többet ajánlani, akkor nincs alku. Akkor viszont a TSMC rosszabbul járt, mert $8000*10k helyett csak $10000*5k pénzt söpör be, viszont neki teljes kapacitásban áll a pénze.
Viszont most lehet, hogy előállt egy olyan helyzet, hogy gyakorlatilag nincs fölös kapacitás, nem szükséges optimalizálni a kihasználtságra, lehet csak a wafer árra.
-
hokuszpk
nagyúr
-
Bevallom nem értem, mi értelme CPU limiten tesztelgetni az IGP-t. Azzal sem megyek sokra sajnos, hogy látom 1080p max beállításokon 10-20 fps-t tudnak az IGP-k. Azt értem, hogy a szélsőértékekkel (CPU limit, GPU limit) mondanak valamit, de a lényeget nem tesztelik, hogy mit tudnak valós körülmények között ezek a procik játékokban, mire számíthat az, aki az IGP-t akarja használni. Igazán odabiggyeszthettek volna egy 1080p medium mérést is, hogy ne fejben kelljen szintetizálni a limites szituk eredményét.
Ha a procirészek erőviszonyára kíváncsi a teszt, akkor ugyanazzal a GPU-val méri a procikat limites szituban, ezt meg is tették, bár itt elég fura eredménye lett a 3600 és a 4750G bírkózásának.
-
S_x96x_S
addikt
közben a TSMC megszüntet néhány diszkontot ..
TSMC Ends Its Volume Discounts For the Biggest Customers, Could Drive Product Prices Upki tudja .. lehet, hogy ez is közrejátszott az $50-os áremelésben ..
"the company will give you a deal of a 3% price decrease per wafer, meaning that the customer is taking a higher margin off a product it sells. Many of the customers, like Apple, NVIDIA, and AMD, were a part of this deal."ez a piac törvénye ...
és igazából a gyártóknál is lehetne egy kicsivel erősebb verseny ..A verseny jó ..
-
S_x96x_S
addikt
válasz
Petykemano #4485 üzenetére
> [link] Ampere Altra
igéretes .. fog még emiatt izzadni az AMD és az Intel ..
pár tesztben meg meglepően jó ..
( direkt az egyik legjobbat választottam, hogy kiváncsi legyél a többi eredményre is .. amik már sokkal rosszabbak .. )"So while Apple's M1 has done a good job for showing the ARM desktop performance potential, Ampere Altra's Q80 series shows what the performance can be like at the top-end for ARM within server and cloud deployments now actually providing serious competition against the current generation Intel Xeon and AMD EPYC servers. Looking ahead, Intel Ice Lake Xeon and AMD EPYC Milan are both expected next quarter. In fighting that Ampere already has their announced 128-core Ampere Altra Max (Mystique) processor that will retain socket compatibility with Ampere Altra and will be in production later in 2021. Given what we have seen with Ampere Altra, it will be very interesting to see how much of a performance leap they can achieve going forward with Mystique. At the same time the AArch64 Linux software support should be further maturing and more open-source projects supporting/optimizing for AArch64 given the successes of Apple M1, the ongoing Windows for ARM work, and ARM Linux servers continuing."
-
S_x96x_S
addikt
Testing The World’s Best APUs: Desktop AMD Ryzen 4750G, 4650G and 4350G
"Overall
It’s clear from our data that AMD’s integrated graphics solutions aren’t great for specific games – Final Fantasy 14 being the key one. However, when pairing this level of integrated graphics with this level of CPU compute, titles like Civilization 6 and F1 2019 shine.
While AMD has not launched Ryzen 4000 APUs for end-users on the desktop, there are a number of segments with their fingers crossed that the next generation of APUs will be coming in desktop packaging. There have been rumors as to what that could be (Zen 3 + Vega, or Zen 3 + RDNA2), and when, and for how much. We look forward to whether AMD plan to push the integrated graphics market further, especially in light of recent launches."
" -
Petykemano
veterán
[link] Ampere Altra
Elég versenyképes.
Hogy így olcsóbb-e abban nem vagyok biztos, nyilván annyiért adják, amennyiért megveszik. Ha magad készítéd a designt, lehet olcsóbban kijönni, persze ahhoz nagy volumenben kell gyártatni.Inkább az az érdekes, hogy ez még mindig N1 és láttuk a +20-40%-os ígéreteket a következő generációra.
-
S_x96x_S
addikt
jövőre jön a ZEN3-as optimalizáció ... ami ad egy újabb kicsi plusz löketet ..
a default "x86-64" -hez képest biztos érdemes kisérletezgetni ...
"At least moving off the generic x86-64 target yields around 11% uplift across all the benchmarks.""AMD Zen 3 Performance With The Initial "znver3" GCC Compiler Support"
https://www.phoronix.com/scan.php?page=article&item=amd-znver3-gcc11&num=1( tesztelve : Ryzen 9 5950X - csak különböző optimalizációval )
összesített: -
2400G-m van, szeretem én is, Skyrim, Dragon Age 3, meg régebbi játékokkal szoktam játszani (1080p, 75Hz FreeSync). Nem vagyok rákényszerülve a váltásra, de eljátszottam a gondolattal, hogy beújítok majd egy 6 magos APU-t, aztán később ki tudja, egy erősebb VGA is befigyelhetne mellé. Ami hiányozhat még nekem (bár még nincs 4K megjelenítő itthon), az a PlayReady 3.0, az kellene a Netflix 4K-hoz, sajna a 2400G nem tudja (3400G már igen).
Bár így, hogy youtube elkezdett VP9-ről AV1-re átállni, már olyanra cserélném, ami tudja azt gyorsítani, Renoirnak még nem megy, RDNA1-től örökölte a multimédiát, AV1-hez RDNA2 kell.
-
TRitON
aktív tag
válasz
solfilo #4479 üzenetére
3400G-t használok itthon (home office) és a munkahelyemen is 3440x1440@100 monitorral, 95%-ban munkára (elektronikai CAD). Az itthoni gépem GPU-jának adtam +200MHz PBO-t, így gyakorlatilag fix 1.5GHz-en működik, ha terhelve van. Régebbi játékok (2013 előttiek + WoT) gyönyörűen mennek Freesync-kel, van, ami full grafikán. Szerintem hibátlan (pláne ~40W-ból - már ami a GPU-t illeti); persze mindig lehetne gyorsabb.
Vártam én is a 4-5000-es széria APU-it, de most úgy látom, hogy legközelebb DDR5-ös cuccot fogok venni, a DDR4-es APU-k (pl. 4700G) nem nyújtanak sokkal többet; de persze meglátjuk, milyen lesz Lucienne. Diszkrét GPU-t pedig valószínűleg soha többet nem veszek.
-
Hogy nem számoltak vele, azt kizárnám, már júniusban volt infó Lucienne-ről, desktop Renoir és Vermeer is később mutatkozott be, szóval ha igaz a mostani pletyka, már tudniuk kellett, hogy nem teszik rendbe teljesen a számozást. (adott szérián belül többféle mag eddig se volt mondjuk szerintük gond, 3000G sorozatban is van 12 és 14nm-es mag pl)
Bár mindegy is igazából, csak jöjjön már valami APU desktop DIY-re, a Picasso már, hogy is mondjam, elavult.és ha már Renoir, megértük azt is, hogy a Media Markt AMD-s gépeket hirdet
-
TRitON
aktív tag
válasz
Petykemano #4475 üzenetére
Viszont desktopon meg elvileg igen, a Ryzen 5000 lineup-ban. Az előbbi idézetem előtti mondat: "Code-named Lucienne (pronounced lucy-en), a feminine French name meaning 'light,' when the processors release, they'll join AMD's desktop parts in going by the Ryzen 5000 series nomenclature."
-
Petykemano
veterán
Hát ezért írtam, hogy a zen3 a cache miatt is lényegesen jobb lesz CPU-ban. Viszont waferben sokat nem nyernek.
A fogyasztást sem tartom valószínűnek. Ott van az 5700U és 5800U. mindkettő 10-25W.
Azt esetleg elképzelhetőnek tartom, hogy az 10-25 típusú Cezanne ugyan lehetséges, de ritkább, nehezebb elérni. Feltéve, hogy a lista teljes, az alapján 35-45W-os változatból nem lesz Lucienne -
Mumukuki
aktív tag
Nem lehet, hogy a zen2 magot jobban tudjak alacsony fogyasztasra optimalizalni es ezert marad a kisebbekben meg egy darabig?
-
HSM
félisten
válasz
Petykemano #4470 üzenetére
Elvileg új, lényegesen erősebb RDNA2 GPU-t kap, nem átnevezett Renoir lesz. [link]
A Cezanne meg marad az alaccsony tranzisztor költségű VEGA GPU megoldásnál, de erős Zen3 magokkal és nagyobb gyorsítótárral a CPU-ban. -
Petykemano
veterán
Elég érdekes számomra is.
Nem gondolnám, hogy halmokban állnának a Renoir lapkák, amiket most átneveznek Luciennre-re és ennyi.
Ugyanakkor a zen2 és zen3 magok között nincs nagy méretkülönbség, tehát waferhasználat szempontjából elsőre érthetetlennek tűnikAz mondjuk különbség, hogy a RNR/LCN esetében 2x4MB L3$ áll rendelkezésre, míg a Cezanne esetében 16MB. Az amúgy is fejlettebb IPC-vel teljesítményben valószínűleg lényegesen nagyobb különbséget fog okozni, mint amekkora differenciát a lapkaméretben okoz (mármint csak a nagyobb L3$, ami kb 10mm2)
-
TRitON
aktív tag
AMD Ryzen 5000 Mobile Series Specifications Leaked
[link]
Szép nagy kavarás lesz a ZEN2-3 magokkal...
Lucienne, gondolom egy Renoir+ (az elnevezés amúgy zseniális, Lucienne Bisson Pierre-Auguste Renoir törvénytelen gyermeke volt), így az inkább csak egy "faceliftnek" tekinthető, a Cézanne az igazi nagy dobás. Kíváncsi leszek, mekkora fizikai különbség lesz a kettő között, illetve hogy mekkora pluszt fog jelenteni egy teljesen integrált megoldás esetén a ZEN3. -
HSM
félisten
válasz
S_x96x_S #4463 üzenetére
Ami szerintem érdekes és számomra új infó, hogy 2008-ban a tranzisztor keret 10%-a ment el a dekóderre, ami azért kiélezett versenyben nem tűnik kevésnek, bár tény, hogy nem is vállalhatatlanul sok. Ez ha nem tévedek K8-K10 architektúra, és 3 dekóder esete magonként, ahol ráadásul erősen dekóder limites volt a rendszer. Érdekes lenne mai környezetben egy hasonló adat.
#4467 Petykemano : Az Arm A5x magok valóban lényegesen jobb perf/watt-ot tudnak, csak éppen meglehetősen alacsony abszolút teljesítmény mellett. Hiszen arra tervezték őket.
Lásd: [link] [link]
-
Petykemano
veterán
válasz
hokuszpk #4466 üzenetére
2021-2022-t írtak.
Szerintem a jelenlegi 5nm-en az Apple le tudna gyártani egy 32 magos procit, ami minden más vonatkozásban arra képes, mint az M1. mondjuk 300mm2-ből?
A maximális teljesítményhez 28 perf + 4 eff magból csinálnám. A semmire 4 kis mag is elég, ahová meg kraft kell, oda kraft kell.
De az Apple kis magjai abban a különleges helyzetben vannak, hogy - ellentétben az Arm A53 vs A77 magokkal - valóban és számottevően jobb perf/w-ra képesek.
Tehát monduk 8 perf + 24 eff mag még mindig meglehetősen energiahatékony lenne (45W), miközben mondjuk egy perf mag teljesítményét hozza. -
hokuszpk
nagyúr
válasz
Petykemano #4462 üzenetére
igen jolehet az a TSMC 5(3?)nm, ha ezt igy kapasbol.
de vajon Big-Little 16+16 vagy 8+24 esetleg csak siman 4+28 ? -
S_x96x_S
addikt
válasz
Petykemano #4462 üzenetére
> Ejha: 32 magos Apple CPU
ajajj ...
ezek után egy 32 magos PRO notebook is elképzelhető. -
S_x96x_S
addikt
> "vagyis a komplexitáson többet veszít az X86-64-ISA - mint amennyit nyer a "tömörségével"
> Ehhez azért komolyabb analízis lenne szerintem szükséges.rengeteg (performance per Watt) teszt van, ami a risc-es ARM-nek kedvez.
a nuvia például ontja magából a méréseket ( gondolom a befektetők miatt is )
de azért érdemes átfutni https://nuviainc.com/blog> ugyanazt a munkát egy RISC architektúra több utasításból végzi el,
lásd (performance per Watt)
> Csupán arra akartam ráirányítani a figyelmet, hogy óriási előnynek tűnhet,
> hogy több a dekóder, de többre is van szükség,
> mert ugyanazt a munkát egy RISC architektúra több utasításból végzi el,
> tehát nem megalapozott az órajelenként dekódolt utasításokból
> és órajelből kiindulni, mert más az utasítás architektúra.jelenleg (már régóta) legeslegbelül az Inteles és az ZEN procik is RISC-esek ..
az X86-64-ISA -t átforditják mikrokódokra ..
10 évvel ezelőtt az AMD - ennek kb 10% overheaded-et tulajdonított .."Az Atom mikroarchitektúra minden szempontból ellentéte az Intel 1995-ben a Pentium Próval megkezdett stratégiájának, miszerint az x86(/x64)-es programok végrehajtásának legcélravezetőbb módja azok egyszerű, RISC műveletekké bontása és ezek out-of-order végrehajtása. " ( 2011 - prohardver )
https://www.anandtech.com/show/8776/arm-challinging-intel-in-the-server-market-an-overview/12
2014: "The RISC vs. CISC discussion is never ending. It started as soon as the first RISC CPUs entered the market in the mid eighties. Just six years ago ( ~2008 ), Anand reported that AMD's CTO, Fred Weber was claiming:Fred said that the overhead of maintaining x86 compatibility was negligible, at the time around 10% of the die was the x86 decoder and that percentage would only shrink over time.
Just like Intel today, AMD claimed that the overhead of the complex x86 ISA was dwindling fast as the transistor budget grew exponentially with Moore's law. But the thing to remember is that high ranking managers will always make statements that fit their current strategy and vision. Most of the time there is some truth in it, but the subtleties and nuances of the story are the first victims in press releases and statements.
Now in 2014, it is good to put an end to all this discussion: the ISA is not a game changer, but it matters! AMD is now in a very good position to judge as it will develop x86 and ARM CPUs by the same team, lead by the same CPU architecture veteran. We listened carefully to what Jim Keller, the head of the AMD CPU architect team, had to say in the 4th minute of this YouTube video:
"The big fundamental thing is that ARMv8 ISA has more registers (32), a three operand ISA, and spends less transistors on decoding and dealing with the complexities of x86. That allows us to spend more transistors on performance... ARM gives us some inherent architectural efficiency."
You can debate until you drop, but there is no denying that the x86 ISA requires more pipeline stages and thus transistors to decode than any decent RISC ISA. As x86 instructions are variable length, fetching instructions is less efficient and requires more transistors. The instruction cache is also larger as you need to store pre-decode information. The back-end might deal with RISC-like micro-ops but as the end result must adhere to rules of the x86 ISA, thus transistors are spent on exception handling and condition codes.
It's true that the percentage of transistors spent on decoding has dwindled over the years. But the number of cores has increased significantly. As a result, the x86 tax is not imaginary.
"persze 10 év múlva még okosabbak leszünk
-
Petykemano
veterán
Ejha: 32 magos Apple CPU
-
HSM
félisten
válasz
S_x96x_S #4459 üzenetére
"vagyis a komplexitáson többet veszít az X86-64-ISA - mint amennyit nyer a "tömörségével"
Ehhez azért komolyabb analízis lenne szerintem szükséges. Csupán arra akartam ráirányítani a figyelmet, hogy óriási előnynek tűnhet, hogy több a dekóder, de többre is van szükség, mert ugyanazt a munkát egy RISC architektúra több utasításból végzi el, tehát nem megalapozott az órajelenként dekódolt utasításokból és órajelből kiindulni, mert más az utasítás architektúra."making designing decoders that are able to deal with aspect of the architecture more difficult"
Itt azért a tranzisztorköltségre vetített extra teljesítményt is érdemes számba venni. Lehet érdemesebb pl. két egyszerűbb magot beépíteni, mint egy túlzottan komplexet, ha egyébként az egy szálon elért teljesítmény megfelelő.#4460 hokuszpk : Ez kinek és miért lenne jó?
Viszont abban látok fantáziát, ami az eredeti koncepció volt, hogy minden chiplet K12, ugyanazzal az IOD-vel, tehát csak CPU-t kell cserélni a szerverben, és át is álltál egyikről a másikra. Ez azért elég egyedi és rugalmas is lenne.
-
S_x96x_S
addikt
> Miért lenne más? Ha egy X86 utasítás-sor "tömörebb",
> akkor adott számú utasítást dekódolva órajelenként,
> azonos órajelen mégiscsak több hasznos "munka" lesz elvégezve,annyira szerintem nem sokkal tömörebb ,
mint amennyivel komplexebb.vagyis a komplexitáson többet veszít az X86-64-ISA - mint amennyit nyer a "tömörségével",
például extrém nehéz dekódolni és párhuzamosítani.-> high ILP (Instruction level-parallelism).
-> high MLP (memory level parallelism)
Anandtech: "Other contemporary designs such as AMD’s Zen(1 through 3) and Intel’s µarch’s, x86 CPUs today still only feature a 4-wide decoder designs (Intel is 1+4) that is seemingly limited from going wider at this point in time due to the ISA’s inherent variable instruction length nature, making designing decoders that are able to deal with aspect of the architecture more difficult compared to the ARM ISA’s fixed-length instructions. On the ARM side of things, Samsung’s designs had been 6-wide from the M3 onwards, whilst Arm’s own Cortex cores had been steadily going wider with each generation, currently 4-wide in currently available silicon, and expected to see an increase to a 5-wide design in upcoming Cortex-X1 cores."
( Anandtech - M1 elemzés ) -
HSM
félisten
válasz
S_x96x_S #4439 üzenetére
Közben jobban megnézve látom, írják ők is, pl. 3DPMavx: "On the power side, we can see why SMT Off mode is warmer – the cores are drawing more power. Looking at the data, SMT Off mode is running ~4350 MHz, compared to SMT On which is running closer to 4000 MHz."
Mikor írtam, nem volt időm alaposan végigolvasni, ebből a részből csak az ábrákat néztem át.#4442 S_x96x_S : "az csak a programkód méretére van kihatással, de a végrehajtás már más"
Miért lenne más? Ha egy X86 utasítás-sor "tömörebb", akkor adott számú utasítást dekódolva órajelenként, azonos órajelen mégiscsak több hasznos "munka" lesz elvégezve, mint egy RISC architektúrán. Az, hogy belül a dekóder hány belső utasításra bontja, már más részegységek baja lesz."persze lehet vitatkozni, de szerintem az X86-64-ISA elég komplex az AArch64 -hez képest."
Nem fogok veled vitatkozni, ez így van. És ez az előnye és hátránya is. Előnye, mert toldozgatják foltozgatják évtizedek óta, alapvetően a kompatibilitás megtartása mellett. Hátránya, hogy többnyire nem optimális egy ennyire komplex, toldozgatott foltozgatott architektúra egy alapokról bizonyos célokra kifejlesztetthez képest."izgalmas évtized jön"
Efelől semmi kétségem.#4446 Petykemano : "Azt mondod, hogy az AT tesztjében nem a backend fogyott el, hanem a TDP?"
Pontosan. Főleg a 12-16 magosok igen könnyen limitessé válnak, sok a mag, valamint a maximális BOOST órajelek is magasak."Vagy megfordítva. a kikapcsolt SMT-t a TDP kereten belül kompenzálja valamivel magasabb frekvenciával."
Pontosan.Az SMT OFF alacsonyabb magszintű kihasználtsága alacsonyabb fogyasztással jár azonos feszen/órajelen (kevesebb a "hasznos" órajelciklus, több a várakozás), amit némileg magasabb órajellel tud orvosolni a boost, ha van még elérhető, nyilván így azért rosszabb hatékonyságot felmutatva. Ezt erősíti meg, amit idéztem az AT méréséből az első bekezdésben.
#4449 S_x96x_S : " Ha 4 erős lenne, akkor multi core-ban is verné a zen3-at."
Azért azt ne felejtsük el, hogy akkor a fogyasztás sem ennyi lenne... Valamint a laptopokba szánt Zen APU-k is lényegesen magasabb perf/watt aránnyal üzemelnek, nem olyan nagyon sokkal lassabban, mint asztali társaik. Asztali Zen-nél komoly kompromisszum, hogy csipletekre szedték a hatékonyabb gyárthatóság kedvéért, de ennek fogyasztás és memória késleltetés terén bőven van ára. -
S_x96x_S
addikt
Elég vad ez az AMD-s ARM procis pletyka ...
"AMD may have an Apple M1 competitor in the works. Rumor is that there are two versions of this chip being developed, with and without integrated RAM. It is possible that AMD could be looking to revive its K12 Core design or improve on it with newer Cortex designs to exploit the highly lucrative ARM market."
-
S_x96x_S
addikt
válasz
-vitya- #4451 üzenetére
> akkor igenis az ARM veszélyessé válna azonnal,
Az AWS Graviton2 az Neoverse N1-es alapú
és
hamarosan jön a
Zeus(V1) ( Cortex-X1 -hez hasonló )
V1 = (N1+50% St perf, PCIe Gen5, DDR5, HBM2e, CCIX 1.1 ) + 64-96 coresPerseus(N2)
N2 = ( N1 + 40% ST perf ; PCIe Gen5, DDr5 HBM3, CCIX 2.0, CXL 2.0 ) + up to 128 cores.https://www.anandtech.com/show/16073/arm-announces-neoverse-v1-n2
"If we take the conservatively clocked Graviton2 with its 2.5GHz N1 cores as a baseline, a theoretical 3GHz V1 chip would represent an 80%
uplift in per-core single-threaded performance. Not only would such a performance uptick vastly exceed any current x86 competition in the server space in terms of per-core performance, it would be enough to match the current best high-performance desktop chips from AMD and Intel today (Though we have to remember it’ll compete against next-gen Zen3 Milan and Sapphire Rapids products)."
> nincs bárhol bevethető szerver konfigurációja ARM-nek, semelyik gyártótól.
> Mivel létezik a kis fogyasztású meg létezik a szerverfarmos, kettő között kb semmi.
tudom .. "This Is Fine" ... -
-vitya-
őstag
válasz
S_x96x_S #4449 üzenetére
gondoltam, hogy ki kellene fejteni pontosabban...
nincs bárhol bevethető szerver konfigurációja ARM-nek, semelyik gyártótól. Mivel létezik a kis fogyasztású meg létezik a szerverfarmos, kettő között kb semmi. Ráadásul ezek sem terjednek, annyira sem, mint az EPYC, pedig az is lassan terjed. Ha minden részen létezne valódi, megfontolható alternatíva, akkor igenis az ARM veszélyessé válna azonnal, mert nagyon erősek az alapok (ahogy írtad is, a tesztek alapján, amit mindketten néztünk ;-) )
-
Petykemano
veterán
válasz
S_x96x_S #4449 üzenetére
Itt van egy specint2006-os táblázat: [link]
Az A77 nagyjából a zen2-zen3 ipc-jével rendelkezik.Ehhez képest tud +70-80%-ot az Apple chipje, A14. Ez persze elképesztő mérnöki teljesítmény.
A bárki által elérhető X1 elvileg az A77-re kb 30% IPC-t rak. Tehát elmondható, hogy már az X1 is meghaladja IPC-ben a zen3-at és az AMD, ha valóban a továbbiakban is csak 15% IPC növekedést hoz generácónként, akkor a zen4 lesz pariban az X1-gyel.Ez persze desktop környezetben nem annyira jön ki, mert ahogy írtad, frekvenciával kompenzál. De szervereknél 3-3.5Ghz az általánosan elérhető frekvencia, ahol energiahatékony a mag, tehát nem lehet frekvencia-előnnyel kalkulálni.
Ez azt jelenti, hogy ha valaki jövőre csinál ez X1 magokból álló szerver cpu-t, annak komoly esélyei vannak lehagyni a Milant. Nyilván ez se pofonegyszerű, mert ugye azt mondják, hogy a jó mag még kevés, sok mag esetén az interconnect is számít.
Lehet, hogy ez nem a Marvelltől fog érkezni. DE szerintem elég valószínű, hogy az AWS hoz egy graviton3-at.
-
S_x96x_S
addikt
válasz
-vitya- #4448 üzenetére
> ha az AMD továbbra is ilyen erős EPYC procikat tud csinálni,
> amihez az ARM alig/nehezen tud felnőni,lehet, hogy más benchmarkot nézünk ???
a mostani epyc (zen2) magokat 3.2Ghzen simán veri a 3.2Ghz-es M1
és a 3.2Ghz-es M1 pariban van a 4.8Ghz-es ZEN3-as magokkal is.Az ARM-ISA -hoz bárki hozzáfér, aki akar.
Az A64FX szerver : HBM2-es memória + 512bites SVE
az AMD-nek nincs se HBM2-es procija se AVX-512 -se .. ( persze ha akarná, lenne )
> de ez annyira nem látszik a szervereknélamikor már látszik, valami
akkor általában már késő ..Mint az Intel ahogyan benézte a ZEN-t .. semmilyen tartaléktervük nem volt .. el se képzelték, hogy beérik őket .. és amikor látták a ZEN1-et akkor is 1 évig csak hitetlengettek .. nincs semmi vész ... nyugtatgatták magukat .
Kell, hogy az AMD az egyik szemével figyelje az ARM-es procikat ... mert úgy jár ő is mint az Intel. ( vagy mint a Nokia, Kodak, ... )
"To summarize: AMD’s brand-new Zen 3 8-core matches the M1 in single-threaded performance and significantly exceeds it in multi-threaded performance, but it achieves both of these outcomes at desktop-level power consumption. Data from the comparison suggests Zen 3 will compare significantly more favorably than Zen 2, but data also indicates that AMD’s mobile performance in a 15W envelope is much lower than when allowed desktop power levels, which only makes sense. If we assume that AMD can improve single-threaded performance by 1.3x and 1.36x — meaning they can achieve the entirety of this uplift in exactly the same power envelope — our hypothetical Zen 3-based mobile CPU scores 1495 / 9248. Even if we make these very optimistic assumptions, the AMD mobile system would still be consuming far more electricity than its Apple counterpart."
https://www.extremetech.com/computing/317304-benchmark-results-show-apple-m1-beating-every-intel-powered-macbook-promegj:
Az M1 multi core-ja azért gyengébb a ZEN3-nál, mert 4 erős + 4 energiahatékony mag van benne. Ha 4 erős lenne, akkor multi core-ban is verné a zen3-at.
-
-vitya-
őstag
válasz
S_x96x_S #4447 üzenetére
Én ezt úgy látom, hogy ez egy HA ... AKKOR feltétel rendszer
ha az AMD továbbra is ilyen erős EPYC procikat tud csinálni, amihez az ARM alig/nehezen tud felnőni, meg az intel sehogy, AKKOR nem kell annyira aggódnia, egyszerűen csak mindig a legjobbat kell tudni szállítani- de mondjuk most meg még aggódhat is, hiszen bár rég lelépte az intelt, de ez annyira nem látszik a szervereknél
ha az intel visszajön, akkor aggódhat, főleg, ha kifullad a nagy menetelés az AMD-nél
ha az ARM nagyon hosszú távon elkezd erős és versenyképes procikat felmutatni a szerverekhez is, akkor hosszú távon igenis komolyan nyerhetnek cégek arm alapon... De szerintem az egy távolabbi jövőkép (lehet) -
Petykemano
veterán
köszi a mérést.
Azt mondod, hogy az AT tesztjében nem a backend fogyott el, hanem a TDP?
Ez azt jelentené, hogy bekapcsolt SMT-vel mondjuk 5-10%-kal alacsonyabb frekvencián megy, ha fullra van terhelve, mint kikapcsolt SMT-vel? Vagy megfordítva. a kikapcsolt SMT-t a TDP kereten belül kompenzálja valamivel magasabb frekvenciával.Egyébként félreértés ne essék: semmiképp sem kívántam azt sugallni, hogy a jelenlegi procikon ki kellene kapcsolni az SMT-t.
-
S_x96x_S
addikt
válasz
Petykemano #4428 üzenetére
ez már elég versenyképes lesz a ZEN3 -al ... ( legalábbis 8 magig )
persze az árazástól is sok függ ...valószínüleg ekkor ( ~ 2021 Március ) körül
inditja rá az AMD a ZEN3-as újabb dömpinget a piacra
és szerintem 5600XT; 5800XT ; 5900XT is várható lesz a maximalistáknak.A RocketLake-S -es prociban azért van pár dolog amin el lehet csábulni egy jó árazás mellett.
( Optane support, AVX-512, DeepLearningBoost/VNNI, PCIe4.0, Integrált GPU )
de azért nem felejtem el, hogy a"Cypress Cove" egy 14nm-re visszaportolt architektúra
és kell neki kakaó ... és hűtés .. vagyis olyan hangos lesz mint egy traktorRemélem lesz akkora már ZEN3-as asztali APU is a piacon.
Amúgy mi a francért nem lehet betenni az 5800X -mellé egy grafikus chipletet ... amit csak egyszerűen berakok egy X300-ba.
lassan kezdek már dühös lenni ... -
S_x96x_S
addikt
> A dekóderes rész nekem ott nagyon sántít, hogy nincs figyelembe véve,
> hogy az x86 komplex utasítás architektúra,
> azaz elviekben (!!!) kevesebb utasításból meg tudod csinálni ugyanazt,az csak a programkód méretére van kihatással,
de a végrehajtás már más.az X86-64-ISA és az ARM-ISA is mikrokódra fordítja át magát,
de míg az X86-os ISA kiterjesztés ( 8bit + 16bit + 32bit + 64 bit )
( szabadon keverheted )addig az ARM-nél át kell váltani az üzemmódot az
AArch32 és AArch64 között, vagyis az én értelmezésemben
2 optimalizált dekóder van, egy a 32bites és egy másik a 64bites utasításoknak.
emiatt az ARM dekódere sokkal egyszerűbb - és ez az egyszerűség tranzisztorban is megjelenik.Az X86-64-ISA annyira komplex, hogy már azt is nehéz megszámolni, hogy pontosan
hány regiszter vagy utasítás van benne.
https://blog.yossarian.net/2020/11/30/How-many-registers-does-an-x86-64-cpu-have
"All told, I think that there are roughly 557 registers on the average (relatively recent) x86-64 CPU core." ( és ebbe az AVX512 -es utasítások nincsenek beleszámítva )persze lehet vitatkozni, de szerintem az X86-64-ISA elég komplex az AArch64 -hez képest.
Ami még érdekes lesz az a
"Tachuym’s Prodigy Universal Processors " - által követett trend
ők nem tökölnek mindent (IS) akarnak futtatni
( x86, ARM and RISC-V binaries )"Prodigy is truly a universal processor. In addition to native Prodigy code, it also runs legacy x86, ARM and RISC-V binaries. And, with a single, highly efficient processor architecture, Prodigy delivers industry-leading performance across data center, AI, and HPC workloads. Prodigy, the company’s flagship Universal Processor, will enter volume production in 2021."
https://www.tachyum.com/pr-2020-08-11.shtmlKözben a RISC-V is megtette a tétet a héten
.. szerintük ők még az ARM-nél is jobb watt teljesítményt nyújtanak ( papiron )
64-bit RISC-V core claims 10x better CoreMarks/Watt compared to other 3-5GHz CPUs
http://linuxgizmos.com/64-bit-risc-v-core-claims-10x-better-coremarks-watt-compared-to-other-3-5ghz-cpus/
"Micro Magic unveiled an up to 64-bit RISC-V core showing a groundbreaking 110,000 CoreMarks/Watt, with a 3GHz chip consuming less than 70mW. The company claims 10 times better CoreMarks/Watt compared to other processors in the 3-5GHz range."persze sok ígéretet már eleve kettővel kell osztani,
de ettől függetlenül a következő 10 év nem lesz könnyű az X86-64-ISA -nak ..
az ARM és a RISC-V jelentős piaci térnyerésével kell számolni az X86-64-ISA kárára
az ARM és a RISC-V -nél az új játékosok belépési küszöbe alacsony.
Sok új játékos lép a piacra és sokan elhullanak ..izgalmas évtized jön! És szerencsére az AMD-nek nem egy Ballmer típusú kormányosa van.
( A verseny jó )
-
S_x96x_S
addikt
válasz
Petykemano #4433 üzenetére
> De az Apple példáját követhetik mások is, pl Qualcomm.
az új "Snapdragon 888" -ban ( 5nm ) már Cortex-X1 magok vannak,
ráadásul 3 szintre elosztva ( 1+3+4 CPU )"The Snapdragon 888 is the first publicly announced SoC powered by the new Cortex-X1 and Cortex-A78 CPU IPs by Arm. The Cortex-X1 in particular is the first of a new generation of CPU IP by Arm that focuses on maximising performance at the cost of lesser power efficiency, while the Cortex-A78 being the same-generation design but which still prioritises a balance between performance, power and area.
The new X1 core, based on Arm’s numbers, promised a +30% uplift in IPC over the last generation Cortex-A77 which was also deployed in the Snapdragon 865. Qualcomm advertises a 25% uplift over the Snapdragon 865, but that’s likely due to a few configuration differences on the part of the new Snapdragon 888 compared to Arm’s own internal figures."
akkor lesz érdekes, ha a málnaPC - 4x Cortex-X1 - maggal jön ki
A "Cortex-X1" -még nem M1-es, de közel jár hozzá. -
S_x96x_S
addikt
> Az a kérdés, hogy saját Apple processzort meddig fogják (tudni) skálázni.
> Mert ez mégiscsak egy ARM. A mostani 10-15 wattos TDP-szint az elvileg
> már eléggé teteje az ARM-nak, tudják vajon ezt tovább tolni?
> Mert akkor lehet igazán veszélyes.
> De jelenleg "csak" az ultramobil piacon tűnik úgy, hogy tarolnak (perf / watt arányban).az arm már rég átlépett a veszélyes kategórián,
az ARM- ISA ( utasításkészlet szabadon licenszelhető ) - bárki bármilyen architektúrát mögé tud tenni.
#1. nyár óta a TOP500 HPC ( szuperkomp"ly"uterek)
listáját egy ARM alapú gép vezeti ( A64FX )
https://www.top500.org/lists/top500/2020/11/
SUPERCOMPUTER FUGAKU - SUPERCOMPUTER FUGAKU, A64FX 48C 2.2GHZ, TOFU INTERCONNECT D https://www.top500.org/system/179807/"Az ARM-alapú Fugaku fejlesztése 2014-ben vette kezdetét, a K computert idővel lecserélendő. A Fujitsu óriása 150 000 darab, 48-magos A64FX processzort állít csatasorba, melyek az Arm v8.2-A utasításarchitektúrára és 512 bites vektormotorokkal dolgozó SVE (Scalable Vector Extension) utasításkészletre építve 7 nanométeres node-on készülnek, 2 GHz felett ketyegő órajelekkel. A 8,786 milliárd tranzisztort tartalmazó lapkák HBM2 memóriát használnak a szokásos DDR interfész helyett, és a köztük való kapcsolat a Tofu interconnect nevű, háromdimenziós hálózati topológia révén jön létre."
https://prohardver.hu/hir/fujitsu_leszallitotta_fugaku_utolso_moduljait.html
A legrosszabb, hogyha az AMD alábecsüli az ARM felől érkező fenyegetést.
inkább becsülje túl - mint alul ... ( alá - Ballmer effect )amúgy most éppen a Patrick Moorhead-et ekézik - az M1-es review-ja miatt..
https://daringfireball.net/2020/12/m1_macs_truth_and_truthiness
"Moorhead’s review bears little relation to the reality of the M1 Macs, but plays right into expectations of the status quo. ARM chips are efficient and Apple’s ARM chips are the best, but none of them are a threat to Intel and AMD’s x86 chips for high-end performance."és gonosz módon felemlegetik, hogy mit irt, az A7 ( első 64 bites chipről )
“Adding 64-bit processor capabilities adds nothing to the user experience today, as it would requires over four gigabytes of memory,” Patrick Moorhead of Moor Insights and Strategy, and a former executive at AMD, told AllThingsD. “Most phones today only have one to two gigabytes of memory, and it will be years before the norm is four.”megj:
Patrick Moorhead - 2011-ben hagyta ott az AMD-t, (a stratégiáért felelt, de ő se láthatja a jövőt)
"Patrick departed AMD in 2011 where he served as Corporate Vice President and Corporate Fellow in the strategy group. There, he developed long-term strategies for mobile computing devices and personal computers. Moorhead also served in his 11 years at AMD leading product management, business planning, product marketing, regional marketing, channel marketing, and corporate marketing. Moorhead also worked at Compaq Computer Corp. during their run-up to the #1 market share leader position in personal computers. Patrick also served as an executive at AltaVista E-commerce during their search leadership reign, pioneering cost per click e-commerce models." https://moorinsightsstrategy.com/patrick-moorhead-3/ -
S_x96x_S
addikt
> Ahogy az AT is megállapította, még úgy sem érdemes kikapcsolni az SMT-t,
> ha az 5950X-es egészen jól kompenzálja órajelből.link
AT: Investigating Performance of Multi-Threading on Zen 3 and AMD Ryzen 5000
( December 3, 2020 10:00 AM EST ) -
HSM
félisten
válasz
Petykemano #4436 üzenetére
"Na nézzük, igaz-e?"
Szerintem itt a méréssel van azért baj. Leginkább, hogy így beleszámoltuk a különböző fogyasztás alapú korlátozások hatását. A TPU-n első ránézésre nem volt túlzottan elengedve a 3900X ( [link] , gyári PPT max 140W, kb reális lehet a számok alapján).
Az AT tesztjéből ennyi sem derül ki sajnos, de erős a gyanúm, hogy a gyári PB beállításokkal mehetett, hiszen nem írt mást, ahol a kikapcsolt SMT rosszabb kihasználtságát és ezáltal fogyasztását pl. magasabb órajellel kompenzálhatta a csip. A fogyasztásméréses adatok is ezt látszanak alátámasztani.
Nekem van egy Ryzen 5 3600-as mérésem Cinebench R15-ben, pontosan ugyanúgy, mint itt [link] írtam, allcore 4,2Ghz-en, limitek nélkül lefuttattam SMT OFF is, és úgy 1145 pontot kaptam, ami alapján a 3600-asom a gyors memóriák mellett is profitált 43%-ot az SMT-ből, ami azért nem kevés. Így lenne érdemes megmérni az 5000-eseket is, fix órajel, limitek nélkül, SMT ON és OFF.Ahogy az AT is megállapította, még úgy sem érdemes kikapcsolni az SMT-t, ha az 5950X-es egészen jól kompenzálja órajelből. A cikkbeni állítással ellentétben nem véletlenül van engedélyezve szinte az összes kis fogyasztású Intel notebook CPU-ban i3-tól felfelé kb. mióta létezik.
-
Petykemano
veterán
A Zen frontend fejlődik, a backend lassan kifogy a szuszból.
Na nézzük, igaz-e?A zen1 (4Ghz-re húzott 1700) van itt egy teszt cinebench R15 teszt: [link]
SMT ON: 1764
SMT OFF: 1252
SMT yield: 41%zen2 (3900X) CB R20: [link]
SMT ON: 7260
SMT OFF: 5553
SMT yield: 30%zen3 CB R20: [link]
SMT ON: ?
SMT OFF: ?
SMT yield: 19%Persze ez csak egyféle workload és nyilván lehetnek olyan programok, amik másként viselkednek. Úgy emléjkszem a zen megjelenésekor a HT 20-30%-ával szemben a zen egyik erőssége volt, hogy 40-50%-os volt átlagosan az SMT yield. Ehhez képest az AT a zen3 esetén 5-35% között, átlag 22%-ot mért.
Úgy tűnik, az IPC hajhászásával a frontend jobban fejlődött, mint a backend. Így már nem is annyira meglepő, hogy nem lett SMT4, amely elképzelés valószínűleg még a 40-50%-os SMT2 yieldre alapozott. Hiszen így már joggal tehetnénk fel a kérdést: erre? Hova?
Elgondolkodtató... vajon ha a tendencia az erősebb frontend fejlesztéssel folytatható? Érdemesebb így csinálni és inkább megszüntetni az SMT-t?
Vagy ez alapján inkább az várható, hogy a zen4-gyel meg fog erősödni a backend, bővülni fog az ALU-k és/vagy az FP feldolgozók száma is és újra magas lesz az SMT yield? -
válasz
Petykemano #4433 üzenetére
Az ilyen Gipsz Jakabok már rég áttértek ARM-ra: tabletet vagy okostelefont használnak noti helyett, mert az is bőven eleget tud erre a felhasználásra. A rendes notebook nekik overkill.
-
válasz
Petykemano #4433 üzenetére
Telefonnál egy eset volt ismeretségi körben, hogy valaki lejött Iphone-ról és többet nem ment vissza, 4 vagy tán 4S-ről Galaxy S3-ra váltott, s azóta is maradt ezen a vonalon (mindjárt látszik, hogy felsőkategóriás telefonról csak felsőkategóriásra szabad váltani
) . Ugyanekkor egy másik haver is meglépte ugyanezt, de ő visszatért az Iphone-ra a Galaxy S3 után.
teljesen más: szólongatnak a Radeon Pro V520 hír alatt: [link]
-
Petykemano
veterán
Én nem úgy gondoltam az almás gép vásárlását, hogy arra felbarkácsolsz egy windows.
Hanem arra, hogy létezhet-e az a jelenség, hogy average joe dönt úgy, hogy a következő notebookja nem windows-os, hanem almás lesz. Főleg, ha ilyeneket hall, hogy gyorsabb is az almás, meg 2x annyu akkuidőt biztosít.Átmenet nyilván nem egyik napról a másikra történne meg. De az Apple példáját követhetik mások is, pl Qualcomm. Bár minden jel arra mutat, hogy az x86 limitáció nem könnyen átléphető kérdés, azért az Apple magjaiban is van munka.
Én egyébként azt gondolom, hogy 25W-nál tovább nem tudják tovább tolni a 4+4-es TDP-jét. Viszont az M1X 8+4-es simán lehet 35, vagy akár 45W-os is.
A rosetta2-re azt mondják egész jó. Én nem tudom.
#4432 solfilo
Ugyanilyen történeteket telefon témában hallottam évekkel ezelőtt Vett vki egy 60e Ftos Android készüléket: lassú, szar, fos
Aztán bement a boltba és vett egy - akkor még - 250eFt-os Iphone-t és elégedett volt. -
válasz
Petykemano #4430 üzenetére
Valóban, hajlamos vagyok élt rakni a kérdésbe, de most nem volt benne.
Mikor írtátok itt, hogy konkurencia, már görgettem is tovább.
A második része talált, tényleg úgy vélem, nem nagyon van átjárhatóság. Legalább is nem nagyon találkoztam még olyannal, hogy egy írásban vesézgetve lenne egy Apple számítógép belseje egy nem Apple termék belsejéhez képest. Aztán ez persze simán lehet csak azért van, mert nem követem máshol sem az almás dolgokat, így nem is találkozhattam ilyennel. De azt mondjuk el tudnám képzelni, hogy ha ennyire jól sikerül(t), esetleg vehetnek a procikból mások is, vagy közvetve mások is eljuthatnak ARM alapon ilyen szintre, s az már veszélyeztetheti mondjuk a noti szegmenst, ha teljes értékűen lehet rajtuk Win-t használni.
Ez az átjárás amúgy érdekes dolog, aki ismerős almás, azt nem nagyon izgatja a hardver, ellenben más szóba sem jön kb. Egy kivétel volt, egy Iphone tulaj haver megkért, segítsek neki 70k-ért notit venni, ajánlottam neki AMD Brazos netbookot, a boltban persze rábeszélték egy Atom-osra. Mondani sem kell, akadt a net, youtube, stb. Mondja ez szar, vett 3x pénzen egy Ipad-et, azzal már persze elégedett volt, azóta se próbált meg többet nem Apple cuccot venni.
-
válasz
Petykemano #4430 üzenetére
Mac és PC között nem igazán van átjárás, mert nem minden szoftver elérhető mindkettőre. Az érdekes az lenne, ha Apple processzoros gépre valahogy fel lehet heftülni windows-t. S habár az x86 menne simán, de az IGP-hez ugyanúgy kéne valamilyen driver, anélkül cseszheted. De ha esetleg mégis lenne valahogy windows driver akkor megint jön egy probléma: nincs eGPU support. Habár ez utóbbit lehet utólag megoldják. Szóval sok a feltétele annak, hogy igazán veszélyes alternatíva legyen.
Az a kérdés, hogy saját Apple processzort meddig fogják (tudni) skálázni. Mert ez mégiscsak egy ARM. A mostani 10-15 wattos TDP-szint az elvileg már eléggé teteje az ARM-nak, tudják vajon ezt tovább tolni? Mert akkor lehet igazán veszélyes. De jelenleg "csak" az ultramobil piacon tűnik úgy, hogy tarolnak (perf / watt arányban).
Érdekesebb téma az, hogy mit indít ez el az ARM-támogatás terén. Ugyanis ez eléggé az AMD malmára hajthatja a vizet. Az AMD skálázásban nagyon-nagyon durván elszaladt. És ott a K12 projekt, amit befagyasztottak, azaz hatalmas előnyben vannak, ha a teljesítmény-orientált piacokon is magára talál az ARM. Persze ehhez lehet lesz egy-két szava az ARM-ot felvásárló NV-nek. Már ha tényleg fel tudják vásárolni az ARM-ot.
-
Petykemano
veterán
válasz
solfilo #4429 üzenetére
Hm, értem a kérdés élét.
Miért gondolod, hogy az Apple sajátos hardvermegoldás csak akkor lehet fenyegető a hasonló termékkategóriában induló x86 processzorra, ha a végtermék nem Apple márkával jelenik meg? A kérdésedből azt olvasom ki, hogy úgy véled, az Apple és nem Apple termékek vásárlói között nincs átjárhatóság és nem lehetséges, hogy valaki azért vásárolja be magát Apple készülékbe, mert - ha most még nem is , de idővel - objektíve jobb hardvert kap, mint amit más nem Apple gyártóktól kaphatna.
Jól értelek? -
válasz
Petykemano #4428 üzenetére
Bevallom, az Apple újdonságait nem figyeltem (M1, M1X), milyen nem Apple termékekbe várhatóak, hogy veszélyeztetik a Zen3-at?
-
Petykemano
veterán
/konkurencia/
Jön nemsokára az Apple M1X
Rocket Lake ~ 5800XUtóbbival kapcsolatban felröppent az a pletyka, esetleg MCM összeköttetésben nagyobb magszámot is tudhat. De lehet, hogy ha igaz is, csupán egy kísérlet, ami nem kerül kereskedelmi forgalomba. Mindenesetre nagyjából ott lenne vele az intel, mint az AMD 2017-ben a zen1-gyel.
Az M1X-szel a Cezanne valószínűleg csak korlátozottan lesz versenyképes.
VAlószínűleg mindkettő konkurens megjelenik jövő év első felében, vagy akár negyedévében.Csak azért mondom, hogy nekem nem tűnik úgy, hogy az AMD ráérne 2 évet (2x14 hónapot) malmozni, virítani kell a zen4-et.
-
HSM
félisten
válasz
Petykemano #4413 üzenetére
Egyébként, hatékonyság témakör. Szerintem érdekes, a gyári BOOST-hoz képest mekkora tartalék van akár egy Zen2-ben is. Én ezt mértem: [link] . Elég impozáns szvsz perf/watt-ra amit a boost nélküli 3,6Ghz órajelén produkált.
#4415 S_x96x_S : A dekóderes rész nekem ott nagyon sántít, hogy nincs figyelembe véve, hogy az x86 komplex utasítás architektúra, azaz elviekben (!!!) kevesebb utasításból meg tudod csinálni ugyanazt, tehát a "dekóderszám x órajel" metrikát erős fenntartásokkal kezelném egy RISC rendszerrel összehasonlítva.
#4426 Petykemano : "Minél nagyobb a ROB (Re-order buffer), annál nagyobb a soron kívül, párhuzamosan végrehajtható utasítások száma"
Ami a ROB-ot illeti, vélhetőleg ott is azért sok tényezős az egyenlet. Például felső korlát a végrehajtó egységek száma a CPU-n belül.Annál nagyobb ROB-ot beépíteni pazarlás, mint ami a végrehajtó egységek hatékony működéséhez az adott csipen indokolt. A Ryzeneken pl. ott az SMT és az óriás L3, ami szintén sokat segíthet utasításokkal ellátni a végrehajtókat és átlapolni az esetleges várakozási időket.
Ami az X86 utasításkészlet átalakítását illeti, az erősen problémás, hiszen az X86 legnagyobb előnye a kompatibilitás. Ha csinálsz belőle egy inkompatibilis verziót, akkor már jobban járnál, ha alapoktól átterveznéd az egészet egy hatékonyabb rendszerre.
"Vajon elképzelhető-e, hogy a 8 decoder beépíte azért lehetséges, mert a sűrű 5nm-en elképesztően rövidek a késleltetések, kicsi a delay."
Szvsz ezt máshogy értik.Ha lassú lenne a dekóder (azaz túl komplex), akkor csökkenne az elérhető órajel, ez nyilván az x86-nál okozhatna problémát. -
Petykemano
veterán
válasz
S_x96x_S #4415 üzenetére
> https://erik-engheim.medium.com/why-is-apples-m1-chip-so-fast-3262b158cba2
A cikk első részével nem teljesen értek egyet. Mármint azzal persze igen, hogy a hardveres gyorsítók számítanak. Azzal nem, hogy a Dell-nek vagy a HP-nek abban bármiféle szerepe tudna lenni, hogy milyen hardveres gyorsítók épülnek be a termékeikbe. Jó, hozzáteszem, ez úgy igaz, hogy nem tudom, ezek a cégek mekkora tényleges befolyással tudnak lenni a szoftveres környezetre. Merthogy a hardveres gyorsítók kihasználhatósága sokkal inkább ezen múlik, mint azon, hogy a gép összerakója mit álmodik meg. Ha a Dell vagy a HP megálmodik valamilyen hardveres gyorsítót, akkor nem elegendő ARM IP-ből összedobálnia, megterveznie, VAGY megrendelni az AMD-től vagy inteltől. Vagy saját magának kell a szükséges szoftvert is hozzátenni, vagy megkörnyékezni az MS-ot, Google-t, hogy nézzétek, milyen jó lenne, ha.
Az idézetedhez pedig hozzátenném:
- Az ILP növelésében segít az Out of Order execution.
- Minél nagyobb a ROB (Re-order buffer), annál nagyobb a soron kívül, párhuzamosan végrehajtható utasítások száma
- A ROB-ot a decoder eteti "micro-op" utasításokkal.
Így összességében az M1-ben a lényegesen 3x nagyobb ROB-ot egy 2x akkora teljesítményű decoder eteti.És a magyarázatban ez a lényeg:
"This is where we finally see the revenge of RISC, and where the fact that the M1 Firestorm core has an ARM RISC architecture begins to matter.
You see, for x86 an instruction can be anywhere from 1–15 bytes long. On a RISC chip instructions are fixed size. Why is that relevant in this case?
Because splitting up a stream of bytes into instructions to feed into 8 different decoders in parallel becomes trivial if every instruction has the same length.
However on an x86 CPU the decoders have no clue where the next instruction starts. It has to actually analyze each instruction in order to see how long it is.Namost két dolgot nem értek.
Úgy tudom, hogy a az x86 processzorokban belsőleg már valóban nem CISC hanem RISC architektúrák, van egy belső fordító. A legújabb atom magban épp az pláne, hogy valódi CISC x86 végrehajtást csinál és így tud energiahatékony lenni alacsony teljesítmény mellett.
A másik dolog: nem tudom, hogy vajon micro-op cache nem pont ezért van-e?És miért ne lehetne valamikortól olyan x86 processzort csinálni, aminek van fix utasítás hossza. Nyilván egy úgy forgatott program nem futna régi processzorokon. De ez kb egy olyan átállást jelente, mint a 32bit vs 64bit. Egy új processzor nyilván tudna visszafelé kompatibilis lenni.
De vajon az Apple-nél nem kell minden programot újraforgatni? Vagy ha A MS úgy dönt, hogy akkor Arm, akkor nem kell mindent újraforgani?De azzal persze egyet kell értsek, hogy az Apple-nek beépíteni 8-16 magot valószínűleg könnyebb, mint az AMD-nek és az intelnek levezényelni az x86-ban egy ilyen változást.
Ugyanakkor ha ez ennyire triviális, hogyhogy csak az apple-nek jutott eszébe?
Egy választ a másik linked tartalmaz (ez nem az x86 utasítás hossz limitációval magyarázza)
"The answer of wide decode and deep reorder buffer gets much closer than the “tricks” mentioned in tweets. That still doesn’t explain how Apple built an 8-wide CPU with such deep OOO that operates on 10-15 watts.
The limit that keeps you from arbitrarily scaling up these numbers isn’t transistor count. It’s delay—how long it takes for complex circuits to settle, which drives the top clock speed. And it’s also power usage."Ahogy írtad is, az intel már most 5 decodernél jár 10nm-en.
A kommentben a hangsúly a késleltetésen, a tranzisztorok gyorsaságán van. Az 5nm ugye eleve sűrűbb és az Apple mindig is a legsűrűbb libraryt használta. Vajon elképzelhető-e, hogy a 8 decoder beépíte azért lehetséges, mert a sűrű 5nm-en elképesztően rövidek a késleltetések, kicsi a delay.
Ha ez igaz, akkor elképzelhető, hogy az intel és az AMD is képes lesz 5nm illetve 7nm-en előrelépni 5 vagy akár 6 decoder irányába.Az urak is jól elvitatkoztak azon, hogy az M1-gyel az Apple az elmúlt 10-20 év ILP növelhetőségének tudományos kutatását tette zárójelbe.
-
-vitya-
őstag
válasz
solfilo #4423 üzenetére
A cég érdeke, hogy a legkevésbé jó ár/érték arányú procikat adják el nagy számban, míg a vásárlók érdeke ennek az ellenkezője
- ezt úgy tudja a cég befolyásolni, hogy nem adja ki az 5600-at az elején
- gondolom egyre nagyobb arány lesz azért az 5000-es széria a jövőben, hónapról, hónapra
-
válasz
Petykemano #4422 üzenetére
Kettős hatás lehet, nem is nagyon kapni, meg nem is jött első körben 5600, csak X, 3700X-nak se lett párja (még?) az új szériában, tavaly nyári alapján ezekre lenne a legnagyobb igény.
-
S_x96x_S
addikt
válasz
-vitya- #4420 üzenetére
> ennek ellenére a mindfactory valahogy mégis eladott kb 5000 darab zen3-at...
remélem azért, hogy a decemberi ( mindfactory ) számokban
legalább egy 10ezres eladást látunk .
( kereslet lenne rá )
ha megint csak ~5000 akkor csalódott lennék ..legyen már rendes készlet végre ...
( itthon is ! )
-
válasz
S_x96x_S #4418 üzenetére
vs 2019 július, amikor a Ryzen 3000 széria nyitott. Akkor közel dupla annyi 3000-est adtak el, mint most 5000-est, miközben jóval alacsonyabb volt az összeladás (összkereslet). Eléggé látszik, hogy nincs készlet.
Az mondjuk elég megdöbbentő a 2020 novemberi ábrán, hogy közel annyi Ryzen 5000 fogyott (shortage ellenére), mint Intel proci összesen.
-
S_x96x_S
addikt
-
S_x96x_S
addikt
CES 2021 Jan 12 Lisa Su ...
https://videocardz.com/newz/amd-ceo-lisa-su-to-present-at-ces-2021-on-january-12thAMD Ryzen 7 5800H (Cezanne Zen3) processor spotted
https://videocardz.com/newz/amd-ryzen-7-5800h-cezanne-zen3-processor-spotted -
S_x96x_S
addikt
válasz
Petykemano #4414 üzenetére
> DDR5 @ 2021Q3
> Na, lesz AM5 2021 végén?ha 14 hónapos fejlesztési ciklussal számolunk, akkor inkább 2022-Q1 lesz ... vagy 2022 CES
persze a versenytárs mindig ösztönzően hat a teljesítményre és nem maradhatnak le túlságosan az Inteltől.
pici az esély, de azért reménykedem
"As it stands, the roadmap shows that AMD intends to introduce DDR5 support for the desktop CPU lineup in 2022. " [link] -
S_x96x_S
addikt
válasz
Petykemano #4413 üzenetére
> A zen3 mag teljesítménye és fogyasztása optimalizálható olyan szintre,
> amikor már csak ~30% választja el a M1 magjaitól.pár napja volt egy érdekes elemzés az M1 és az x86 architektúra közötti eltérésről ..
amiben a szerző az M1 Firestorm - nál azt emeli ki, hogy
8 párhuzamos utasítás dekódere van, mig az x86-nál az eltérő utasításhosszak miatt ez 4
( vagyis a fele ( #1. )
és emiatt (is) az M1 60%-on (3.2Ghz) tudja hozni az 5Ghz-es ZEN3 teljesítményét. ( #2. )megj: persze a ZEN2-nél a microde-os végrehajtás és sok más dolog is - a dekódolás után 8 utasra változott, de a 4-way -es utasításdekóder maradt .. a ZEN3-nál is ( Decode: 4-way )
( Az Inteles Ice-lake -re 5-way -t irnak , vagyis nem lehetetlen az 5 utas dekóder. )(#1)"And this is where we see the huge differences. The biggest baddest Intel and AMD microprocessor cores have 4 decoders, which means they can decode 4 instructions in parallel spitting out micro-ops.
But Apple has a crazy 8 decoders. Not only that but the ROB is something like 3x larger. You can basically hold 3x as many instructions. No other mainstream chip maker has that many decoders in their CPUs."(#2)"As far as I remember from performance benchmarks the newest AMD CPU cores, the ones called Zen3 are slightly faster than Firestorm cores. But here is the kicker, that only happens because the Zen3 cores are clocked at 5 GHz. Firestorm cores are clocked at 3.2 GHz. The Zen3 is just barely squeezing past Firestorm despite having almost 60% higher clock frequency.
So why doesn’t Apple increase the clock frequency too? Because higher clock frequency makes the chips hotter. That is one of Apple’s key selling points. Their computers unlike Intel and AMD offerings barely need cooling."https://erik-engheim.medium.com/why-is-apples-m1-chip-so-fast-3262b158cba2
HN: https://news.ycombinator.com/item?id=25257932 -
Petykemano
veterán
Na, lesz AM5 2021 végén?
-
Petykemano
veterán
válasz
S_x96x_S #4411 üzenetére
"és az M1 után a Nuvia célja már nem is annyira valószínűtlen .."
Igen, természetesen. Főleg, hogy a Nuvia asszem 2022-re ígért terméket.
Ide is bedobom, hogy mennyire lehet játszani a zen3 magok energiahatékonyságával:
[link]
komment itt: [link]tl;dr
A zen3 mag teljesítménye és fogyasztása optimalizálható olyan szintre, amikor már csak ~30% választja el a M1 magjaitól. A zen3 lényegesen nagyobb package powerhez nyilván hozzájárul a 14nm-es IO és az MCM. Majd meglátjuk Cezanne-nal mit tud.az AT fórumon valaki spekulál, hogy mit hozhat a zen4, milyen cache bővítés fér bele, mi az ami már inkább ront a késleltetésen, stb. Felmerül annak lehetősége, hogy az L3$ mérete visszacsökken 16MB-re, és cserébe az 512KB-os L2$ bővül 1MB-ra.
-
S_x96x_S
addikt
válasz
Petykemano #4408 üzenetére
> [Konkurencia]
> M1 postgresql benchmarkvárható volt, de azért eléggé ütős lett az M1 - mint az ARM éra új zászlóshajója..
és az X86-os emulációnál ( ami kb 70% teljesítménnyel futtatja az X86-os kódokat )
éltek is a lehetőséggel, és beleraktak pár érdekes dolgot a prociba.
pl. át tud váltani a proci az Inteles memória elrendezésre .. és ekkor nem a szoftveres emulációs rétegnek kell ezt a feladatot elvégeznie ..
https://twitter.com/ErrataRob/status/1331735383193903104
"4/ So Apple simply cheated. They added Intel's memory-ordering to their CPU. When running translated x86 code, they switch the mode of the CPU to conform to Intel's memory ordering."És ha továbbgondolom:
#1. akkor szerintem az AMD( vagy Intel) is beleteheti a következő prociba
az ARM-es memória modellre váltás lehetőségét,
amivel az ARM-es programokat lehet majd az X86 -alatt gyorsan futtatni .#2. Az AMD-nek meg van a lehetősége, hogy teljesen heterogén procit csináljon - ami az X86-ot és ARM-et egyformán jól futtatja ... merész lépés , ami veszélyekkel is jár .. de szerintem ez lehet az egyik trend. ( legalábbis ha a Cloud üzemeltetők felőli nyomást érzékelem ; vagyis minimális hardverrel lefedni a legtöbb igényt - igény lenne rá ..
és én mint fejlesztő is el tudnék képzelni egy ilyen laptopot .. )#3. az M1-es nyomdokait követve az nVidia is csinálhat egy ideális - univerzális szerver procit, ( mivel az Apple nem akar egyenlőre a szerveres piacon operálni )
és valószínüleg stratégiailag kénytelen is lesz,
mert nincs más választása.#4. fél szemmel a Nuviát figyelem .. mivel egy kiugrott ex Apple-s chiptervező a CEO-ja.
https://nuviainc.com/leadership
https://nuviainc.com/blog
és az M1 után a Nuvia célja már nem is annyira valószínűtlen ..
NUVIA Phoenix Targets +40-50% ST Performance Over Zen 2 for Only 33% the PowerA jövő érdekes kérdései,
- az AMD hogy reagál az ARM-es kihívásokra.
- az nVidia mit kezd azzal a hatalommal, hogy ő határozza meg az ARM jövőjét. -
S_x96x_S
addikt
ASRock Rack ROMED4ID-2T Mini-ITX Motherboard For AMD EPYC Rome CPUs Launched, Supports Up To 64 Core & 128 Thread Chips
https://wccftech.com/asrock-rack-romed4id-2t-mini-itx-motherboard-for-amd-epyc-rome-cpus/https://www.asrockrack.com/general/productdetail.asp?Model=ROMED4ID-2T#Specifications
Proprietary (Deep mini-ITX)
4 DIMM
2 RJ45 (10GbE)
1 PCIe4.0 x 16 -
S_x96x_S
addikt
Linux kernel fix ..
AMD+SUSE Tackling Frequency Invariance For AMD EPYC 7002 CPUs
https://www.phoronix.com/scan.php?page=news_item&px=AMD-EPYC-Rome-Freq-Invariance -
Petykemano
veterán
[Konkurencia]
M1 postgresql benchmarkElég kemény
-
S_x96x_S
addikt
megtesztelte a Phoronix is az Intel állítását ..
( Ubuntu alatt ! vagyis ez Linux-os teszt )
[link]"So, long story short, in some cases the AMD Ryzen 5 4500U being tested did see more conservative clocking behavior when running on battery compared to AC power. It depended upon the particular workload though as to the relative hit and in some areas particularly with multi-threaded workloads the performance could come out around the same. In some of those multi-threaded workloads, the much cheaper Ryzen 5 4500U laptop was already outperforming the much pricier Intel Core i7 1165G7. The Dell XPS 13 notebook with i7-1165G7 in some workloads was seeing a performance hit on battery, but especially more so as the battery was diminished. Intel DPTF appears to cause the performance behavior to shift depending upon the battery level at which point it seems to severely keep the CPU down-clocked in order to extend the battery life rather than being more conservative on a full charge."
-------
és pl. itt elég furcsa az akkus teljesítménye az Intelnek, pedig a PyBench az Intelnek kedvez.
( a 4500u még ZEN2-es mag )annyira nem rossz a Tiger Lake -se .. , de azért azt is kell még csiszolni.
-
-vitya-
őstag
válasz
S_x96x_S #4404 üzenetére
Hát ez ugye nem meglepő fordulat
Ha valahogy, valamiben első tud lenni, akkor marketing szempontból ki KELL azt domborítani.
Most majd láthatjuk: amelyik oldal átveszi, hasonló komment nélkül, mint amit az ET tett, az részrehajló oldal. Nem néztek mögé, és nem vizsgálták meg a dolgot jobbanDe ja, teszteljenek csak ACvel ÉS DCvel is. Láthatjuk ETnél, hogy nem olyan rossz a helyzet Ryzennél
-
S_x96x_S
addikt
security; Spectre és a Meltdown felrázott mindenkit a szakmában
...
jön a Pluton ,
és még Linux-ra is van valami igéret ..
.. "and there should even be support for Linux in the future, too."persze azt még nem tudom, hogy jó-e ez nekem ..
AT: “Microsoft Pluton Hardware Security Coming to Our CPUs”: AMD, Intel, Qualcomm
"All of the silicon vendors involved will have Pluton as the first layer of security – additional layers (such as AMD’s PSP) will go below this. From the three vendors, AMD has worked with Microsoft already on Pluton for consoles, so it should not be a big step to see Pluton in AMD consumer and enterprise silicon sooner rather than later, along with AMD’s other technologies such as Secure Encryption Virtualization. Intel stated that its long-term relationship with Microsoft should lead to a smooth Pluton integration, however the company declined to comment on a potential timeline. Qualcomm is the odd-one-out in a sense, as its cycles are a little different, but the company is quoted as stated that on-die hardware root-of-trust security is an important component of the whole silicon."
-
S_x96x_S
addikt
válasz
Petykemano #4402 üzenetére
Az ExtremeTech nem ért egyet az Intellel ..
Intel Is Spreading FUD About Supposedly Huge Ryzen 4000 Performance Drops on Battery https://www.extremetech.com/extreme/317657-intel-is-spreading-fud-about-supposedly-huge-ryzen-4000-performance-drops-on-battery
-
TESCO-Zsömle
titán
válasz
Petykemano #4402 üzenetére
Plusz ne akarjanak már beleszólni a független tesztelők módszereibe...
-
S_x96x_S
addikt
Intel beindította a TigerLake marketing gépezetet..
"Intel: AMD Weak On Battery-Powered Laptop Performance - But DPTF On Linux Still Sucks"
https://www.phoronix.com/scan.php?page=news_item&px=Intel-Battery-Performance"They basically promote that Intel Tiger Lake notebooks deliver better plugged/unplugged performance than AMD Ryzen systems... And they also were suggesting to reviewers that they do their notebook benchmarking in an unplugged state or otherwise test both modes."
Új hozzászólás Aktív témák
Hirdetés
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- bitpork: Augusztus 2- szombat jelen állás szerint.
- PlayStation 5
- Folyószámla, bankszámla, bankváltás, külföldi kártyahasználat
- Autós topik
- Tőzsde és gazdaság
- Bluetooth hangszórók
- Parkside szerszám kibeszélő
- Melyik tápegységet vegyem?
- Filmvilág
- További aktív témák...
- HP Probook 640 G2 (14FHD/i3-G6/8GB/256SSD/Magyar/Win11) - Szép!
- AMD Ryzen 5 5500 - Új, 3 év garancia - Eladó!
- Kamerarendszerek telepítése //// Gyengeáramú hálózatok kiépítése //// Informatikai segítségnyújtás
- Hibátlan Apple iPhone 15 Pro - Kártyafüggetlen - 128GB Fekete Titán (87% Akku)
- Apple iPhone 14 Pro, Kártyafüggetlen, 1 Év Garanciával
- Konica Bizhub C220 - A3 fénymásoló
- 13-14" Új és használt laptopok , üzletitől a gamerig , kedvező áron. Garanciával !
- BESZÁMÍTÁS! Microsoft XBOX One S 2TB játékkonzol garanciával hibátlan működéssel
- Geforce GTX 1050, 1050 Ti, 1060, 1650, 1660 - GT 1030 - Low profile is (LP)
- Bomba ár! Dell Latitude E7440 MAGYAR - i5-4GEN I 8GB I 256SSD I 14" FHD I HDMI I Cam I W10 I Gari!
Állásajánlatok
Cég: CAMERA-PRO Hungary Kft
Város: Budapest
Cég: PC Trade Systems Kft.
Város: Szeged