Hirdetés

2024. április 25., csütörtök

Gyorskeresés

Hozzászólások

(#101) Dr. Romano válasza Abu85 (#99) üzenetére


Dr. Romano
veterán

El is képzelem az AMD konferencia szobát a proci kiadásának előtti napján:
"
- .Hát.... ez ennyit tud, ilyen lett.
- Jááóóó azz! majd megveszi akinek kell "
:DDD

Ez....e...ee...ez egy.... ez egy FOTEL???

(#102) Noukoum válasza Dr. Romano (#101) üzenetére


Noukoum
veterán

A vicc az hogy még a mai napig helytáll szegény agyonfikázott 8350.

„Kettős úton halad az emberi élet: Egyik a gyakorlat, másik az elmélet. ”

(#103) Dr. Romano válasza Noukoum (#102) üzenetére


Dr. Romano
veterán

Jaja, játékokban hozza egy G4560 tempóját.

Egyébként ez pont annak köszönhető hogy évekig "álltunk" egyhelyben (tick/tock)

[ Szerkesztve ]

Ez....e...ee...ez egy.... ez egy FOTEL???

(#104) Kansas válasza Abu85 (#97) üzenetére


Kansas
addikt

Erősen kétlem.
Ha az lenne, ilyen cikkek sem születnének, mint a "Generalization of Pollack Rule and Alternative Power Equation", amiből egyértelmű, hogy több verzió létezik, és mindegyik korlátolt hasznosságú.

Vagy olvasd el ezt a hozzászólást egy vonatkozó diskurzusban.
Egyrészt:
"Also keep in mind pitfalls defining complexity for purpose of comparison between different devices." - tehát már a design-ok összehasonlítási alapja is sántít...
Másrészt:
"In any case, even for the more unfavorable case of the 4790k, the difference between the core area and the value predicted by the rule was of 30% or something as that." - ha 30% eltérés van a predikcióhoz képest, az nem fizikai törvény, hanem, ahogy írják is, egy "rule of thumb" - mint kb. az összes többi ilyen megfigyelt szabályszerűség az IT-ban.

De hagyjuk, ez nagyon off...

[ Szerkesztve ]

Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.

(#105) BerserkGuts válasza Abu85 (#94) üzenetére


BerserkGuts
őstag

Hát annyit értek hogy egy E8400 jobb egyszálas teljesítményt nyújtott és az 2008-as termék
Amíg a buldózer 2011-es,
8350 2012 kb :B

[ Szerkesztve ]

12600KF/ROG Strix 4070ti/ROG Strix B660/Noctua NH-D15S/ROG Strix AuraEdition 850W/SamsungOdysseyG7 32" 1440p/ThermaltakeTower900/RazerViper8K/F4-3200C14D-16GFX(FlareX)/Kingston A2000

(#106) Noukoum válasza BerserkGuts (#105) üzenetére


Noukoum
veterán

Egy e8400-al 1080p-ben jóformán semmit nem érsz, ellentétben az fx-el.

„Kettős úton halad az emberi élet: Egyik a gyakorlat, másik az elmélet. ”

(#107) Frawly válasza BerserkGuts (#105) üzenetére


Frawly
veterán

Ja, látszik, hogy kemény 3%-kal jobb az E8400 egy szálon. Ennyi már 2008-2011-ben sem számított, mikor fontosabb volt az egyszálas teljesítmény. Ma már viszont a modern OS-ek ütemezője jobban ki tudja használni a több magot, több szálat, jobban figyel a numa egységekre (bár még mindig el van maradva ebben a Win10, a Linux jobban áll ezen a téren, lásd a rengeteg magos Threadripperek sebesség/kihasználtság-deficitjét Windows alatt). Ezért a Bulldozerek több szálon még ma is jól tartják magukat, mikor az E8400 meg már elvérzik modern (több szálra is jobban skálázódó) progik és játékok alatt, vagy mikor már túl sok minden fut egyszerre.

Ezért szűk látókörűség csak a jelenlegi állapotokra procit venni, gondolni kell a jövőre. Az 1. gen Ryzen is jobban tartja magát a korához képest, mint a vele egy időben vagy még pont előtte megjelent Intel procik.

Egyébként félreértés ne essék, a Bulldozer nem volt valami jó architektúra, nem is akarom mindenáron védeni. De voltak dolgok, amiben megelőzte a saját korát, és nem volt annyira kaka, mint amennyire divat ekézni mind a mai napig. Úgy néz ki a CPU gyártók ilyenek, mindig kell nekik egy-egy kísérleti zsákutca ahhoz, hogy legyen fejlődés, meg egy-egy pofon, amiből tanulnak. A Bulldozerből egy csomó dolgot átemelt az AMD a Ryzenbe (pl. SMT), meg a modulokból lettek a chipletek, és már nem követte el a régi hibákat, szóval profitáltak belőle. Ahogy az Intelnél is a Hyper Threading, meg a hosszú pipeline-ok átmentődtek a P4 Netburstből a későbbi generációkba.

(#108) Abu85 válasza Kansas (#100) üzenetére


Abu85
HÁZIGAZDA

Definiálják is a magot. Tehát meg lehet nézni, hogy mit értenek rajta. Ilyen formában nyolc mag van benne.

Az Atomban is 4 mag van, még sem ér fel egy kétmagos Core vagy Ryzenhez. Nem ez határozza meg a teljesítményt.

Az alku azért volt, mert így olcsóbb. Bele lehet állni, és akkor megnyerik, de mennyibe fog kerülni 20-30 millió dollár?

(#104) Kansas: Az IT-szabályok 99%-a megfigyelésre alapoz, viszont valós fizikai ok is van a többségük mögött.

(#107) Frawly: Nem azért mennek zsákutcába, hogy aztán jól kijöjjenek belőle, hanem azért, mert a P6-nak a korlátjain nem tudnak majd túllépni. Most még náluk van az x86/AMD64 előnye, de az ARM a Cortex-A76-tel már jobb a hardver tekintetében. És ez alapvetően abból ered, hogy hiába próbált az Intel és az AMD új irányt kezdeni, egyszerűen a piac visszakényszerítette őket a P6-szerű dizájnra.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#109) Kansas válasza Abu85 (#108) üzenetére


Kansas
addikt

Az elejére válaszul: én sem állítottam mást, csak annyit, hogy ha nem magok számával hanem modulok számával reklámoznak, nincs olyan rossz szájíze az embereknek és talán ez a per se lett volna(tudom, akkor az lett volna, hogy ahol a Bulldozer erősebb, ott "nem fair az összehasonlítás, 2x annyi mag van" :D )

"Az IT-szabályok 99%-a megfigyelésre alapoz, viszont valós fizikai ok is van a többségük mögött." - lehet, viszont amíg a fizikai törvények nem függenek a fejlesztések irányától, az IT "törvények" csak annak változatlansága mellett maradnak igazak. Mihelyt a szekvencialitásról a masszív többszálúságra, vagy X86/64-ről RISC-V-re, már csak igen korlátozott predikciós képességük marad.

Természetesen a visszafelé kompatibilitást nem lehet elvágni egyik napról a másikra, akármennyi teljesítményt is lehetne nyerni, hisz azok akik még a proci-gyártóknál is többet invesztáltak az x86/64-be 3rd party programok, komplett folyamatrendszerek, adatközpontok, stb. képében, nem fogják hagyni, illetve nem fogják venni az újat helyette, hanem megvárják az átállással, míg kirohad alóluk a régi(és a processzor lassan rohad...).

Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.

(#110) Frawly válasza Abu85 (#108) üzenetére


Frawly
veterán

Abban egyetértek, hogy az ARM meg a tisztán RISC architektúrák a jövő. Az x86-ban túl sok a legacy korlát, amit dobni kéne már az i686-tal együtt. Ez a visszafelé kompatibiltási mánia is felesleges, a mostani modern gépek már eleve nem kompatiblisek a régi OS-ekkel, nincs floppy, nincs soros/párhuzamos port, IDE még emuláva van egy ideig a Legacy BIOS-szal együtt, de ez meg fog szűnni, ha jönnek az UEFI only gépek, NVMe-vel sem tudnak mit kezdeni meg a sok terabájtos lemezekkel, új hardverekhez sincs driver. Így visszafelé kompatibilitás van elméleti szinten (még egy DOS is ugyanúgy fut a mai procikon, ahogy anno egy XT-n vagy 286-oson), de gyakorlatilag nem használható semmi értelmesre.

Akinek meg kellenek legacy appok, játékok, futtatja emulációval, még emulációs overheaddel is simán bírják futtatni ezeket a modern gépek.

(#111) Kansas válasza Frawly (#110) üzenetére


Kansas
addikt

"Akinek meg kellenek legacy appok, játékok, futtatja emulációval, még emulációs overheaddel is simán bírják futtatni ezeket a modern gépek." - aha, ezt mondd a Google-nek, az Amazonnak, az IBM-nek vagy a Microsoftnak akiknek dollármilliárdok állnak az adatközpontjaiban.
Egyébként korántsem biztos, hogy a RISC a jövő, de a jelenlegi CISC-ekhez képest valóban úgy tűnik(bár többek szerint a jelenlegi X86/64 valahol a RISC és a CISC között van, afféle hibrid, nem "igazi" CISC).

Érdekes lenne látni, mivel állna elő az Intel vagy akár az AMD, ha a visszafelé kompatibilitással nem kéne törődniük...

[ Szerkesztve ]

Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.

(#112) dabadab válasza Frawly (#110) üzenetére


dabadab
titán

"Az x86-ban túl sok a legacy korlát"

Ez mindig fel szokott merülni, de egyre kevésbé látszik az, hogy milyen konkrétum lenne emögött. Momentán az, hogy az x86 a CISC utasításokat teljesene processzorspecifikus mikrokódra tudja dekódolni, az inkább tűnik előnynek, mint hátrányak: a dekódolás szinte semennyibe se kerül és a mikroutasítások meg a konkrét architektúrára optimalizáltak, nem olyan általánosak, mint az ARM esetén.

"Ez a visszafelé kompatibiltási mánia is felesleges"

Ha tényleg az lenne, akkor veszettül terjedt voln az Itanium meg az ARM-os Windows. Ehelyett mindkettő befuccsolt, leginkább azért, mert jól láthatóan a visszafele kompatibilitás igenis fontos.

"Így visszafelé kompatibilitás van elméleti szinten (még egy DOS is ugyanúgy fut a mai procikon, ahogy anno egy XT-n vagy 286-oson), de gyakorlatilag nem használható semmi értelmesre."

???

A valóságban az van, hogy pl. a windowsos világban vígan használnak kurrens OS-eken és processzorokon akár 15-20 éves programokat is.

DRM is theft

(#113) hokuszpk válasza Frawly (#107) üzenetére


hokuszpk
nagyúr

"A Bulldozerből egy csomó dolgot átemelt az AMD a Ryzenbe (pl. SMT), "

:U
mar megint atkerultem egy masik univerzumba. ahonnan jottem, ott a Bulldozerben nemvolt SMT.

Első AMD-m - a 65-ös - a seregben volt...

(#114) dabadab válasza hokuszpk (#113) üzenetére


dabadab
titán

A Bulldozerben részleges SMT volt, az FPU meg az L2 cache elérése működött több szálon, az integer rész nem.

DRM is theft

(#115) Dr. Romano válasza hokuszpk (#113) üzenetére


Dr. Romano
veterán

Itt nálunk 8 magosak és 16 szálasak voltak az FX-ek. Üdv nálunk utazó ;]

Ez....e...ee...ez egy.... ez egy FOTEL???

(#116) Kansas válasza Dr. Romano (#115) üzenetére


Kansas
addikt

Melyik? Tudtommal a Bulldozer-ek legnagyobbika az FX-9590 volt 4 modul/8 mag felépítéssel. No 16 szál, no SMT...

Ha ironizáltál, írásban nem jött át...

(#117) Dr. Romano OK ;)

[ Szerkesztve ]

Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.

(#117) Dr. Romano válasza Kansas (#116) üzenetére


Dr. Romano
veterán

Maradjunk annyiban hogy a szmájli és a slideres klipp nem volt elég meggyőző....

Ez....e...ee...ez egy.... ez egy FOTEL???

(#118) Frawly válasza hokuszpk (#113) üzenetére


Frawly
veterán

De, pont erről szól a egész hír, ami alá kommentelsz. A Bulldozer procik 8 maggal voltak hirdetve, közben meg 4 magosak voltak, a másik 4 mag amolyan fél mag volt, mert csak ALU-t tartalmazott. Na, a Hyper Threadingnek és az AMD SMT-nek is pont ez a lényege, hogy korlátozott feldolgozóegységek, amelyek nem teljes értékű magok, besegítenek. Magyarán de, a Bulldozerben pont volt SMT, csak ezt az AMD akkor nem így nevezte, hanem magoknak hirdette, ezért indult ellene a per, ezért kellett most pénzt fizetnie. De ezt a vonalat az AMD továbbvitte a későbbi procikba, csak most már SMT-nek van aposztrofálva, nagyon helyesen.

(#119) Frawly válasza Kansas (#111) üzenetére


Frawly
veterán

Pont egy Google, Microsoft féle cégóriásnak mindegy, mert megvannak nekik a saját forráskódjaik, és újraforgatják, átportolják olyan architektúrára, amilyenre csak akarják.

Meg az x86 kivezetését sem úgy gondoltam elképzelni, hogy egyik nap még használják, aztán azonnal kidobják az ablakon. Az új architektúrának ki kéne előbb jönnie, el kéne terjednie, fokozatosan állna át rá mindenki.

(#112) dabadab: majd telepíts fel MS-DOS-t vagy Windows 9x-et modern gépre, és meglátod miről beszéltem. Az új Windowsokban a visszafelé kompatibilitás nem 100%-os. Vannak régi alkalmazások, játékok, amelyeknél gondok vannak. Az x86 visszafelé kompatibilitásáról volt szó egyébként is, nem a Windowsérol. Tehát az x86-os procik tartalmaznak egy csomó elavult CISC utasítást, amit ma már semmi nem használ, valós módot, virtuális módot (figyelem: ez nem virtualizáció, ne keverjük, előre szólok), két szóméretet is támogatnak egyszerre 16/32 bit vagy 32/64 bit. Na, az ilyen dolgokat kéne kidobni, mert nem sok értelme van. Egy ideig jó persze, hogy a régi legacy szutykokat is lehet futtatni, de ezeket egy szinttől emulálni is lehet (ha nagyon régi szoftver, a teljesítményét sem szokta negatívan befolyásolni), a fejlődést meg így visszafogják.

[ Szerkesztve ]

(#120) DraXoN válasza Frawly (#119) üzenetére


DraXoN
addikt
LOGOUT blog

Szerintem előbb születik olyan cpu amiben van pár x86 mag, és sok-sok RISC (akár ARM) mag.
Csak rendszer szinten kellene megoldani az egyidejű működést onnantól... aztán "szép lassan" ha a risc annyival gyorsabb és hatékonyabb, akkor arra át fognak térni a programozók pár generáció alatt, közben az x86 rész folyamatosan "butulhat" a régebbi dolgokkal kapcsolatban először csak a 16/32bites részét emulálva, majd haladva "tovább"..
De ha rendszerszinten a 2 mag együttműködése nem megoldható, akkor nincs értelme ennek az elvnek, sok "felesleges" tranzisztort pazarolnánk el.. A másik véglet az emulálás, de ehhez nem elegendően erősebbek a risc cpuk, vagyis nem tudják kipótolni azt a teljesítményvesztést ami az emulálással keletkezik, hiába gyúrják ki nagyon az x86tól megszabadított, hardveres emulációra képes RISC részeket, akkor is lassabb lesz mint az azonos területen építkező x86 egység ... az egyetlen ami erre terelhet, ha esetleg jelentősen egyszerűbb a cpu felépítése miatta... a mostani cpuk is részben csak emulálják az eredeti x86ot (csak ahol tényleg nyernek vele, vagy a skálázódás ezt megköveteli)...
A szoftveres emuláció meg sose lesz olyan hatékonyságú, sokkal jobb hatékonyságú cpu kéne ahhoz, hogy értelme legyen gondolkodni is rajta, mert különben onnantól az "összes cpu" belépőszintű teljesítményt nyújtana, HEDT fogyasztás mellett...

Az x86 fejlesztésére a netburst/bulldozer irány nem jöttbe, az atom/bobcat ha úgy tetszik, szintén egy irány volt, de az se lett megfelelő, a larabee és utódai szintén felfoghatók "teljesítménynövelő kísérletnek", hisz végső soron utóbbiak visszakerülhettek volna a cpu belsejébe ha annyira hatékony irány lett volna..

Lehet van hatékonyabb CPU architektúra a saját területén, de más teljesítmény szinten lehet elvesztené az előnyt, főleg ha az utasítások "minősége" is a képbe kerül (itt már elvérzik az ARM, amíg csak egyszerű dolgokat akarunk tőle tényleg jó)... kicsit ez olyan mint 2 túrázó, mind kettő képes a túlélésre a hegyekben egy késsel és mondjuk kb bármit megcsinál ami kell, levadássza a kaját, gyűjtöget, közben halad az úton.
De az egyiknek csak a "törhetetlen" kése van és a hálózsákja, a másik meg cipel magával sátrat, némi élelmet, ruhát (stb.) ... az első gyorsabban halad amíg nem kell valami, mert akkor a környezeti "erőforrásból" kell előállítania (kaját keresni, mivel nincs sátra fedett helyet keresni ha elered az eső, stb)...
Ha jó az idő lehet gyorsabb, de ha sok "probléma" jön, lehet lemarad valahol mert valamit "készít"...

Ettől független az ARM veszélyes lehet az x86 hegemóniára bizonyos területeken... de ha a windows is úgy akarja lehet lesznek majd "hibrid" CPU-k (anno volt ezzel projektje az AMDnek, és a mostani zenben is van ARM egység, igaz utóbbi "nem aktívan elérhető", belső dolgokat művel, de azt hiszem csak a PRO cpukban aktív).. Ha lesznek hibrid cpuk, akkor lehet idővel az x86 csak "gyorsító" egységgé válik.. De az intel ez ellen lehet küzdeni fog majd, mert a Qualcomm már most próbálkozik a másik irányból az "x86ot" csak emulálva (csak elakadt a projekt "jogi úton" :U )... utóbbival mondjuk egy Atom szintű cpu-t ki lehetne váltani (sokaknak elég is lenne, ha nem spórolnak a háttértáron észre se vennék, az atom is utóbbi miatt volt sokszor "gyenge" sokaknak otthonra)...

The human head cannot turn 360 degrees... || Ryzen 7 5700X; RX580 8G; 64GB; 2TB + 240GB + 2TB || Samsung Galaxy Z Flip 5

(#121) Frawly válasza DraXoN (#120) üzenetére


Frawly
veterán

Ez a hibrid procis ötlet érdekes. Szerintem még hibriddé sem kéne tenni, elég lenne egy társproci, ami akkor lenne használva, ha olyan legacy kód fut, és lehetne valami olcsó, lassabb proci, max. 1-2 maggal, mert a legacy kódoknak úgyse kell nagy teljesítmény. De a szoftveres emuláció mindig egyszerűbb, csak az overheadje nagyobb.

Egyébként most néztem két érdekes videót. Az egyik a GTX970 VRAM-járól szólt, hogy a cég ott is adott vissza pénzt a vásárlóknak, mert a 4 GB VRAM-ból csak 3,5 GB VRAM használható ki full teljesítménnyel. Eléggé hasonló eset.

A másik, hogy az AMD-t most meg a Ryzen 3xxx-ek turbófrekije miatt támadják, nem sok embernek sikerül elérni a meghirdetett frekiket. Bár ez nem tűnik akkora fiaskónak, hogy per legyen belőle, de úgy néz ki, hogy az AMD marketingeseknek itt is kicsit vastagon fogott a ceruza, mikor a specifikációkat meghirdették.

(#122) DraXoN válasza Frawly (#121) üzenetére


DraXoN
addikt
LOGOUT blog

A teszt az utóbbinál eléggé vegyes, egyik, hogy 1 magra szól a meghirdetett turbó (ami terhelés manapság igen ritka, ha más nem valami háttérfolyamat "közbeszól").
A másik, hogy eléggé alaplap specifikus gondnak látszik, mert egyes alaplapokban jobb, másokban alacsonyabb az órajel (akár 200-250Mhz különbséget is előfordul).. Néhány alaplap már alap járaton olyan szinten túlfeszeli a cpu-t hogy az már az órajel rovására megy, más alaplapok (főleg "alacsonyabb kategóriásak") 100Mhz alapórajel helyett lehet csak 97-98Mhz alapórajelen "futnak" ami már közel 100Mhz cpu órajel "vesztés" (pár user manuálisan direkt megnöveli ezt az értéket 102-103Mhz környékére, ezzel megint kb. 100Mhz-et nyerve... csak stabil legyen).

De látszólag van valami gond a PBO-al a 1.0.0.3 agesában (miért indul ez a számozás újra minden új cpu kiadásakor? meh), mert 1.0.0.2-es sorozatban sok alaplap esetén magasabb volt ez elért órajel (az 1 szálas, de a többszálas meg "rosszabb" volt)...

De a boost órajel nem fix, eléggé függhet a szilícium minőségtől is (meg az alaplap VRM minőségtől, és hűtéstől, a maximum órajelhez pl. a gyári hűtés szintén kevés, oda kell a víz).

Majd meglátjuk a 3950X-re milyen minőségű chippek jutnak (lehet nem véletlen nevezik "GAMER" procinak AMDnél, és a legjobb asztalira szánt chippeket abba rakják, mondjuk ez valószínű is, csak lehet abba "tényleg jó" egységek kerülnek és "akár" az al-core órajele is magasabb lesz mint a többi cpunak)... a különbség, az utóbbi proci induló ára olyan magas, hogy azon a cpu-n a profit már vetekszik az Epic cpukon levő profittal, így megérheti oda nem a "gyengébb" chippeket tenni...

[ Szerkesztve ]

The human head cannot turn 360 degrees... || Ryzen 7 5700X; RX580 8G; 64GB; 2TB + 240GB + 2TB || Samsung Galaxy Z Flip 5

(#123) frescho válasza Abu85 (#89) üzenetére


frescho
addikt

"A Zen bemutatóján volt két mérnök. Az egyik mondta, hogy a Bulldozert anno úgy tervezték, hogy egy modulon belül maximalizálják az egyszálú teljesítményt. Ezért gyorsult a második száltól csak 60-80%-ot a rendszer két magra vetítve, mert az első szál már eleve megnövelt erőforrásokat kapott, így gyorsabban tudott dolgozni, mintha két kisebb magot alakítottak volna ki. Két kisebb maggal ugyanott lettek volna két szállal, de egy szállal lassabb lett volna a rendszer."

Tervezték, de végül nem lett igaz. Mérnökként nem lett volna képem kiállni és ezt elmondani. Nem értetted félre amit mondtak? Írásos/videó anyag van róla? Amiért még mindig kételkedek:

- Az elérhető anyagokban a tervezési alapelv a szilicium méret (transistor budget) / teljesítmény javításról szólt. Ilyen szempontból nagyon sok szálas programokban jól sikerült a Bulldozer. Az utolsó mondatod is ezt erősíti és azzal egyet tudok érteni.

A második mondatodra megint visszakérdeznék:

- Mik voltak a közös részek?
- Ha azok nem voltak alulméretezve, akkor miért nem tudtak kiszolgállni egy komplett modult? (Itt arra gondolok, hogy lehet, hogy egy maghoz képest 160%-ra volt méretezve, de két maghoz bizony 200% kellett volna.)

A P4-es résszel nem értek egyet, mert ott a felépítés sokkal kevésbé volt egzotikus és a két problémából csak egy volt közös a Bulldozerrel. P4-nél a legegyszerűbb programok is gyorsultak. A közös probléma a gyártástechnológia volt. Nem véletlen, hogy ma is 4GHz körül mozog a procik értelmes órajel limite, az 5GHz bár elérhető de brutális TDP-vel. A P4-nél az Intel, a Buldozernél a GF nem tudta ezt átugrani. Egyszerűen érthetetlen, hogy az AMD mérnökei miért futottak neki ugyanannak a falnak amibe az Intelnek már beletört a bicskája.

A AMD másik hibájának bemutatásához tőled idézek.

"A limit a szoftver."

"A felhasználók tudása rendkívül korlátozott a mérnökökéhez képest. Nem értik, hogy mit miért csinálnak, rosszabb esetben félreértik. Lásd a Bulldozer esetében. Az volt a hit, hogy a modulos felépítés miatt volt lassú az egyszálú teljesítmény. Pont emiatt volt nagyobb, mint amilyen lett volna a modulos felépítés nélkül. Csak ugye nem tudod megmagyarázni nekik, mert nincsenek meg az ismereteik hozzá, hogy megértsék."

Aminél tévúton jársz és az AMD is belement ebbe a zsákutcába az a piac megreformálásának a hite. 10% alatti részesedéssel prófétának lenni nem működött. A szoftver adott volt és mindenki nagyon jól tudja, hogy évek kellenek egy új technológia bevezetésétől annak széles körű kihasználásáig. Ebbe a környezetbe az alapcsony IPC és órajel páros kihozatala hiba volt. Nem kicsit "mindenki szembejön a pályán" érzés lehetett a mérnököknek.

A felhasználókat az teljesítmény, illetve az ár/teljesítmény érdekli. Mérnökként lefuttattam rajta 10-20 tesztet és gyengének bizonyult. Még ott is, ahol elvileg sok szál volt maximum egyenlőt tudott hozni magasabb fogyasztással, azonos áron. Nem érdekelt senkit, hogy 10 vag 20 mm2-ert sziliciumot megspóroltak. A reakció az volt nem 1-2 embertől, hogyha az új architectúra lassabb IPC-ben és szinte abszolút értékben is, akkor miért nem a Phenomot kalapálták ki jobban.

"A célcsoportot nem választják. Viszi, akinek kell."

"célcsoport (Target Group): azon - marketing célok alapján meghatározott - emberek csoportja, akiket a kampány illetve egyéb kommunikációs tevékenység során elérni szeretnénk."

Márpedig azt a marketing/sales választja. Ha az AMD nem tudta kinek akarja eladni, akkor ott még nagyobb volt a gond. De ezt nem hiszem, nem merem elhinni.

Frawly: Az nem ekézés, ha kimondjuk, hogy a tervezésnél rossz irányt vettek. Intelnek is volt ilyen és most éppen az AMD-nek van jövőbemutatóbb, skálázhatóbb procija. Nekem az nem tetszik amikor nem mondjuk ki, hogy valami bizony el lett kefélve.

Az ARM már évek óta "jön" de valamiért nem akar ideérni. Két gondot látok. Az egyik, hogy amikor felskálázzák máris sokat veszít az energiahatékonyságából. Egy mai CPU-nál a fogyasztás nagy részét már nem is a klasszikus "mag" , hanem az azt kiszolgáló részek kérik. Az AMD ezt vágta szét most ügyesen, csak ehhez kellett a megfelelő interposer, a magok közötti összeköttetést biztosító busz és még kismillió más dolog. A másik gond az, hogy egy google-nél is nagyon sok pénznek számít egy meglévő komplett OS-nek akár más processzoros verzióját bevezetni. Csak pár dolog ami hirtelen eszembe jut:, hogy kell belőle szeparált: hardver tervezés, beszerzés, szoftver build, deploy, test/staging, repository...

[ Szerkesztve ]

https://frescho.hu

(#124) Abu85 válasza frescho (#123) üzenetére


Abu85
HÁZIGAZDA

Alapvetően igaz lett, mert a második szál csak 60-80%-ot gyorsított az első szálhoz képest, vagyis egy szál egy modulon nagyobb teljesítményre volt képes, mint amennyi amúgy lett volna benne, ha nincsenek összevonva az egyes erőforrások.

Úgy magyarázták, hogy hardveres szinten alig volt közös rész. Annyi történt igazából, hogy az egyes kritikus részegységeket tervezték túl, hogy ki tudjanak szolgálni két szálat is.

A Pentium 4 ugyanott csúszott el, ahol a Bulldozer. Az nem véletlen, hogy az Intel és az AMD is letér a P6-szerű dizájnok irányáról, és együtt elcsúsznak. Én az ötlet szintjén mindkettőt megértem, hogy miért csinálták, hovatovább még egyet is értek vele, hogy erre kellene menni, viszont a piac nem kész arra, hogy ilyen éles váltást akár az AMD, akár az Intel megcsináljon, függetlenül attól, hogy mennyire jó ötletek voltak a Pentium 4-ben és a Bulldozerben.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#125) hobizoli válasza frescho (#123) üzenetére


hobizoli
nagyúr

nemtom
en anno azt olvastam vhol, hogy az FX-nel az utemezoben volt a "hiba", mert abbol egy latott el ket vegrehajtot, igy sok volt az uresjarata, hiaba volt magas az orajele

több drón kell ;P

(#126) hobizoli válasza Dr. Romano (#103) üzenetére


hobizoli
nagyúr

hat az attol fugg miben nezve

több drón kell ;P

(#127) hokuszpk válasza Frawly (#118) üzenetére


hokuszpk
nagyúr

anno a Sun aszonta ahhoz, hogy smt kepes legyen a Sparc, kb. a lapkaterulet 5% -at kell bealdozni.
nagyon leegyszerusitve meg kell duplazni a regiszterkeszletet, meg felkesziteni a hw -t, hogy pl. cache miss eseten valtson. A Bulldozer azert ennel joval tobb reszegyseget duplazott, nemtom minek nevezzuk, de abban a formaban biztos nem hivnam en sem SMTnek.
arrol nem is szolva, hogy ha megis annak nevezzuk, akkor a Ryzenbe biztos nem azt emeltek at.

[ Szerkesztve ]

Első AMD-m - a 65-ös - a seregben volt...

(#128) hokuszpk válasza Frawly (#119) üzenetére


hokuszpk
nagyúr

"Az új Windowsokban a visszafelé kompatibilitás nem 100%-os. Vannak régi alkalmazások, játékok, amelyeknél gondok vannak."

majd ranezek mar, a Lines.exe vajon a w10 -et is csontrafagyasztja ?

[ Szerkesztve ]

Első AMD-m - a 65-ös - a seregben volt...

(#129) Dr. Romano válasza hobizoli (#126) üzenetére


Dr. Romano
veterán

Napszemüvegben?

Ez....e...ee...ez egy.... ez egy FOTEL???

(#130) attila9988


attila9988
őstag

Bár sok érv elhangzott arra vonatkozóan, hogy a "mag" definíciója gyártófüggő, ezért az amd bármit elnevezhet annak amit akar, függetlenül attól, hogy az megfeleltethető -e legnagyobb riválisának termékeiben alkalmazott megoldásoknak.
Ez így teljesen igaz, és védhető. De sokan elfelejtetitek azt a tényt, hogy az amd a saját korábbi termékeiben alkalmazott definíciótól is eltért. Így tehát nem csak az intel termékeivel összehasonlítva kritizálható az amd marketingje, hanem - szerintem joggal - saját, előző generációs phenom cpu -ival összehasonlítva is.
Ha az egyik termékemben a "mag" mint szerkezeti elem, nem ugyanazt takarja mint a másik, azonos kategóriába eső termékemben, az alkalmas a vásárlók megtévesztésére. Különösen azért, mert ez volt a bulldozer marketing egyik központi eleme. (ti. 8 mag)

Fontos megjegyezni, hogy az amd a mai napig gyárt bulldozer cpu -kat, mindenki használja is őket, ha bekapcsolja a ps4 -et, vagy az xbox -ot.

[ Szerkesztve ]

„Csak az apró titkokat kell védeni. A nagy felfedezéseket a nyilvánosság hitetlensége védi.” (Marshall McLuhan)

(#131) Abu85 válasza attila9988 (#130) üzenetére


Abu85
HÁZIGAZDA

Az AMD az Athlon 64 idején definiálta a magot. A definíciót a HSA specifikációjának elkészülésével módosították csak. Ez lényegében annyit tesz, hogy a magnak HSA-val kompatibilisnek kell lennie, de semmi többet. Az alapvető definíció maradt ugyanaz: egy mag olyan tetszőlegesen programozható hardveres blokk, amely képes legalább egy folyamatot futtatni saját kontextusán, illetve virtuális memóriaterületén belül, függetlenül a többi magtól.

A konzolokban nem Bulldozer van.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#132) DraXoN válasza attila9988 (#130) üzenetére


DraXoN
addikt
LOGOUT blog

De maga a cpu felépítés is eltér, így közvetlen nem összevethető a dolog...
"nincsenek olyan fix határok"

The human head cannot turn 360 degrees... || Ryzen 7 5700X; RX580 8G; 64GB; 2TB + 240GB + 2TB || Samsung Galaxy Z Flip 5

(#133) Kansas válasza attila9988 (#130) üzenetére


Kansas
addikt

Tehát azt mondod, ha Lamborghini úr eddig csak traktorokat gyártott, akkor nem gyárthat sportkocsikat is a traktorok mellett?

A konzolokban pedig nem Bulldozer van, hanem Jaguar - hasonló, de nagyon nem ugyanaz, nem is beszélve a mellé rakott grafikus magról és a használt API-ról.
Ezzel együtt valamelyest bizonyítja, hogy nem életképtelen a koncepció, csak optimalizálni kell rá... Azért gondolom a következő genertáció a Zen magokkal meg RDNA grafikával némelyest többet tud majd...

[ Szerkesztve ]

Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.

(#134) attila9988 válasza Kansas (#133) üzenetére


attila9988
őstag

Valamiért úgy emlékeztem, hogy a jaguar a bulldozer -el van rokonságban, de igazatok van, és nem...

Viszont... ha felépítek egy marketinget barackmagokra, majd egy következő marketinget dinnyemagokra, és mindkét esetben csak mint "magok" hivatkozok a marketing tevékenység tárgyára, az félrevezető lehet a kevésbé hozzáértő vásárlók számára. Tehát a marketingesek hibáztak.
Ennyi az állításom.

[ Szerkesztve ]

„Csak az apró titkokat kell védeni. A nagy felfedezéseket a nyilvánosság hitetlensége védi.” (Marshall McLuhan)

(#135) Kansas válasza attila9988 (#134) üzenetére


Kansas
addikt

Akkor a mobiltelókban levő magok se érnek? Az is csak mag... pedig tök másmilyen.

Ez olyan, mintha a kerék csak traktorkerék lehetne... :P

[ Szerkesztve ]

Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.

(#136) hokuszpk


hokuszpk
nagyúr

a dinnyetermelok neveben Kikérem magomank ! :DD

Első AMD-m - a 65-ös - a seregben volt...

(#137) Dr. Romano válasza attila9988 (#130) üzenetére


Dr. Romano
veterán

Bulldózer alapú proc valóban gyártott az AMD 1-2 éve még. Szóval átmentette magát az AM4-es foglalatba az AMD A12-9800 proci képében.

Ez....e...ee...ez egy.... ez egy FOTEL???

(#138) DraXoN válasza Dr. Romano (#137) üzenetére


DraXoN
addikt
LOGOUT blog

még idén januári gyártású 8350 is létezik (bár szerintem már csak a tokozása történt idén, de létezik)...
[kép]
a fenti CPU az idei év első hetében "készül" ... simán pályázhat a modell a "2000 utáni időszak leghosszabb ideig gyártott CPUja címére" ...

Már nem gyártják (valószínűleg), de amilyen gyorsan elfogytak a boltokból a készletek, az emberek még mindig vehették őket... Ami alapján azért annyira sikertelen termék nem volt (csak a hírneve volt rossz).

[ Szerkesztve ]

The human head cannot turn 360 degrees... || Ryzen 7 5700X; RX580 8G; 64GB; 2TB + 240GB + 2TB || Samsung Galaxy Z Flip 5

(#139) Frawly válasza DraXoN (#138) üzenetére


Frawly
veterán

Mondjuk azt nem tudom kinek gyártják még ezeket. Mióta itt a Ryzen, ami ráadásul sikeres is, nincs értelme Bulldozert gyártani. Azt megértem még, hogy a kereskedő próbálja kiszórni a fennmaradt készleteket, de hogy még idén is gyártani, az kicsit erős. Ennek a lejárt, nem túl sikeres termékvonalnak már teljesen felesleges fenntartani gyártósort. Főleg, hogy a Ryzen 3xxx annyira sikeres, hogy pl. 3900-asból már most hiány van több helyen, kapkodják el, mint a cukrot, erre kéne ráállítani a gyártósorokat. Vagyis úgyis chipleteket gyártanak, egyfélét, ezt kéne nyomatni, nem egy régi modellt, amire már nincs igény.

Egyébként a Bulldozer sem lenne még eladhatatlan, ha kellően levinnék az árát, de nem viszik. Egy vele egy fajsúlyban lévő Ryzen proci árának a feléért, harmadáért adnák, még talán meg is érné. De így nem nagyon, mert a Ryzen 1600-as nagyon olcsó lett (már 25k alatt is van újonnan az Aliexpressen), mellette labdába nem rúg egyik Bulldozer sem, még a legerősebbek sem, amelyen szintén hasonló áron mennek, vagy még többször többért. Mint írtam, nem ekézni akarom, de ennyiért nem érik meg.

[ Szerkesztve ]

(#140) paprobert


paprobert
senior tag

Egyébként amint kiderült, hogy a Bulldozer ekkora melléfogás lett, miért nem portolták a Thuban-t 32 nm-re?

Az első 2 évben egy erősebb ajánlat lett volna desktopra. Fogyasztás ugyanaz, egy szálon jobb, IPC-ben jobb, az órajel is valahol 4 GHz körül tudott volna lenni...

[ Szerkesztve ]

640 KB mindenre elég. - Steve Jobs

(#141) Bici válasza paprobert (#140) üzenetére


Bici
félisten

Szerintem akkoriban lógott az AMD keze a HSA bilibe.
Gondolom arra számítottak, hogy majd GPU compute-tal megoldják a CPU erő hiányát, ami szerintem nagyon jó ötlet lett volna, csak nem jött be. :D

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html

(#142) Yutani válasza Bici (#141) üzenetére


Yutani
nagyúr

Voltak tervek, de nem lett belőle semmi. Az egyszeri fórumozó ezt hánytorgatja fel, mit ígérgetés. Meg Poor Volta... :DDD

#tarcsad

(#143) Abu85 válasza Bici (#141) üzenetére


Abu85
HÁZIGAZDA

Itt van

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#144) Bici válasza Abu85 (#143) üzenetére


Bici
félisten

Tudom, ismerem a ROCm stack-et, legalábbis azt a részét, ami linuxon is megy.
A "nem jött be" alatt azt értem, hogy a heterogén compute nem tette szükségtelenné a gyors procikat.

Yutani: Én nem róvom fel. Legalább próbáltak valamit alkotni.

[ Szerkesztve ]

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html

(#145) Turcsika


Turcsika
junior tag

Véget ért az egyik, sajnos kezdődik a másik?

https://www.techpowerup.com/258840/der8auer-only-small-percentage-of-3rd-gen-ryzen-cpus-hit-their-advertised-speeds

(#146) Bici válasza Turcsika (#145) üzenetére


Bici
félisten

Azóta már jött rá BIOS frissítés, linuxra meg mikrokód.

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html

(#147) Turcsika válasza Bici (#146) üzenetére


Turcsika
junior tag

ez nem az :(

(#148) Bici válasza Turcsika (#147) üzenetére


Bici
félisten

Miből gondolod, hogy nem az?
A Zen2 boost órajelek eléréséről szól mindkettő.

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html

(#149) paprobert válasza Abu85 (#41) üzenetére


paprobert
senior tag

"A modul lényege az egyszálú teljesítmény maximalizálása volt, mert ha egy szálon futott a számítás, akkor lényegében az a szál egymaga megkapta a túlméretezett, két szálra tervezett részeket."

vs.

2012-es magyarázatod
"A Bulldozer fő szempontja a throughput teljesítmény kitolása volt, amihez elővették Pollack szabályát. Ha egy szálon várod a teljesítményt, akkor nem az volt a cél, hogy ott jó legyen. Ha a throughput tempót várod, akkor az növekedett."

Itt valami nem kóser. :N

[ Szerkesztve ]

640 KB mindenre elég. - Steve Jobs

(#150) Abu85 válasza paprobert (#149) üzenetére


Abu85
HÁZIGAZDA

Kisebb magokkal, több építhető a lapkába, és ezzel a throughput teljesítmény növekszik. A modul pedig arra van, hogy egy szál teljesítménye legyen maximalizálva, mivel a második szál már csak 60-80% pluszt hoz.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#151) paprobert válasza Abu85 (#150) üzenetére


paprobert
senior tag

De akkor mégis hova a csudába bújt el a jó egyszálas teljesítmény? Toporgás, IPC-visszalépés történt.

Ha technikailag helytálló lenne az, amit írtál, akkor erre az egyetlen logikus magyarázat az lenne, hogy kisebbek lettek a magok, mint aminek kellett volna lenniük. Gyakorlatilag túltolták a throughput-optimalizáltságot, és ennek az egyszálas teljesítmény látta kárát.

De ha megnézzük az elköltött tranzisztormennyiséget és a méretet az adott gyártástechnológián, akkor a Zambezi pazarlóbb mint a Thuban, nyoma sincs annak, hogy akár tranisztorszámban, akár méretben visszavágták volna az FX magokat.

[ Szerkesztve ]

640 KB mindenre elég. - Steve Jobs

(#152) Yutani válasza paprobert (#151) üzenetére


Yutani
nagyúr

Elég hosszú lett a Bulldozer pipeline-ja, ott vesztett sokat az IPC-ből.

#tarcsad

(#153) apatyas válasza paprobert (#151) üzenetére


apatyas
Korrektor

A Phenom II -nek 3* alu+agu volt az integer blokkjában, a bulldozernek (legalább is az elején, ahogy emlékszem változtattak még rajta) meg csak 2* . Az előző hsz-beli dolgokkal együtt, arra tervezték hogy magas órajelen tudjon futni. De a szilícium nem így akarta. (ez a P4-el a hasonlóság)

pezo77 #5 2017.12.14. 13:29 Hmm. És ez az e-hajó akkor hol is tud kikötni? Az e-bay -ben? ;)

(#154) paprobert válasza Yutani (#152) üzenetére


paprobert
senior tag

Tudod, egyre nehezebben vagyok hajlandó tolerálni bármelyik ilyen "ez a hibás" elméletet.

Hallottunk már annyi mindent az elmúlt években, bűnbaknak lett kikiáltva:
-a gyenge frontend,
-az osztott FPU,
-a túlbonyolított cache alrendszer
-a túl hosszú pipeline
-a nem 6-8 GHz-en futó példányok
-a szoftvervilág igényei

A felsoroltak bármelyike gondot okoz, de 1-1 sor önmagában nézve nem válaszolná meg a teljes kudarcot.

A valóság az, hogy

1. egy szálon gyenge lett a fejlesztés. Ez a kiindulópont.
2. a modult teljesen leterhelve az INT : FPU arány eltolódik az optimálisból INT túlsúlyba, amivel az FPU részleg INT üresjáratot okoz, és gyakorlatilag FPU hiány áll be. Nesze neked magduplázás.
3. High performance library-vel is órajel és fogyasztás plafonba fejelt az AMD.

Teljesen másról szólt volna a Bulldozer történet, ha a bázis egyszálas teljesítmény ott lett volna a szeren, mindenki, beleértve engem is állva tapsolt volna.
Ehelyett jöttek "csak emiatt nem jó, de milyen jövőbemutató, majd a heterogén éra, majd a HSA, majd a Mantle, majd a DX12" urban legendek.

A Zen tudta kombinálni az elfogadható IPC-t, a versenyképes órajeleket dense library-vel is, a valódi magokat balanszolt erőforrásokkal. Mindez fejlett energiagazdálkodással, egy korrekt node-on.

A világot sem kellett megváltani, jó is lett.

[ Szerkesztve ]

640 KB mindenre elég. - Steve Jobs

(#155) Abu85 válasza paprobert (#151) üzenetére


Abu85
HÁZIGAZDA

A szoftver. A Pentium 4 és a Bulldozer ugyanott bukott el. Nem hasonlítottak a P6-dizájnhoz, és így nem voltak jók hozzá a tipikus szoftveroptimalizálások. Ennyi. A Zen egy P6-hoz hasonló dizájn, és rögtön működik.

Viszont a P6-szerű dizájnoknál sok a korlát, vagyis lehet, hogy a gyakorlatban jól működik, de az ARM már most jobb a Cortex-A76-tel, és akkor még hol vannak az igazán nagy teljesítményre tervezett dizájnjaik...

Az Intel és az AMD is rajta van már a heterogén dizájnokon. Az AMD a ROCm (HSA), míg az Intel a OneAPI (SYCL) koncepciót üti most, mert tudják ők, hogy ha nem tudnak új dizájnokat behozni a processzoroknál, akkor el kell kezdeni átalakítani az egész rendszert.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#156) apatyas válasza Abu85 (#155) üzenetére


apatyas
Korrektor

És mégse ott murdelt meg mindkettő, hanem az elérhető órajeleken illetve a bezabált fogyasztáson - gyártástechnológiai kérdések. Noha az igaz, hogy a Bull egy szálon kevesebb volt, de órajellel behozta volna. Vulkánnal meg dx12-vel kellett volna kicsit jobban iparkodni, és egyből nincs annyi nyávogás. Aki meg dolgozik rajta, annak jó. Kivéve a szintén őskövület, egyszálas, vagy tényleg nem többszálúsítható folyamatokat. Azokat attól tartok, a heterogén éra se menti meg.
Szőni tessék vele, az többszálú :D

[ Szerkesztve ]

pezo77 #5 2017.12.14. 13:29 Hmm. És ez az e-hajó akkor hol is tud kikötni? Az e-bay -ben? ;)

(#157) paprobert válasza Abu85 (#155) üzenetére


paprobert
senior tag

Az Intel által megszellőztetett tervek a CPU fronton valóban a CPU feldolgozókkal való kitömését célozza, illetve megfejelik az egészet a GPU-val a párhuzamosított ökoszisztémával. Teljesen kukába dobják az egyensúlyt? Koránt sem.

Látni kell, hőgy ők is evolúcióban gondolkodnak, simán a P6 DNS-re építkezve.

De odaállni a fejlesztők elé, hogy "Szevasztok, holnaptól lesztek szívesek megoldani a feladatot az eddigi 1 helyett 0.5-0.7 teljesítménnyel". Na ez így nem megy. (Bulldozer)

Egy ma jól működő dizájnt is lehetséges optimalizálni throughputra. A szoftverfejlesztők szeretni is fogják, mert ha ki tudod használni, nyersz, de ha nem tudod sem baj, mert az extra teljesítmény továbbra is ott van a régi jól bevált keretek között.

Én az AMD-től is ezt várom, a CCX-ek nagyon jó lehetőséget kínálnak egy felpimpelt, throughput-barát működésre, ahogy a belső interconnect tempója növekszik a következő 2-3 generációban.

[ Szerkesztve ]

640 KB mindenre elég. - Steve Jobs

(#158) frescho válasza Abu85 (#124) üzenetére


frescho
addikt

"Úgy magyarázták, hogy hardveres szinten alig volt közös rész. Annyi történt igazából, hogy az egyes kritikus részegységeket tervezték túl, hogy ki tudjanak szolgálni két szálat is."

Nem válaszoltál a kérdésemre, hogy konkrétan mik voltak a közös részek. Az eredeti Bulldozer bemutatódban a chip nagy része közös.

"A Pentium 4 ugyanott csúszott el, ahol a Bulldozer. Az nem véletlen, hogy az Intel és az AMD is letér a P6-szerű dizájnok irányáról, és együtt elcsúsznak."

Konkrétan mi volt az amiben a P4 elbukott és megegyezik ugyanez a hiba a Bulldozerben? Könnyű a szoftverre fogni, de semmi konkrétumot nem írtál, hogy mi volt a közös a P4 és a Bulldozer platformban. Konkrétan mit jelent az, hogy "P6-szerű dizájn" és a P4 miért skálázódott elfogadhatóan addig amíg nem futottak bele a maximális frekvencia/fogyasztás falba?

https://frescho.hu

(#159) Abu85 válasza apatyas (#156) üzenetére


Abu85
HÁZIGAZDA

Amit ugye azért nyomtak nagyra mindkét esetben, mert a szoftverek miatt nem jött máshogy a teljesítmény. Ok és okozat. :)

(#157) paprobert: Ennél azért jóval továbbmennek. A mostani tervekben gyakorlatilag olyan dizájnok szerepelnek egy tokozásra, amelyben van CPU, GPU, FPGA, AI részegység, és ezek képeznének gyakorlatilag egy egészet. Például az AMD például az integráció szempontjából CPU-ban és GPU-ban gondolkodik, illetve GPU-n belüli specializált AI részegységen. Tehát közel sem annyira extrém a koncepciójuk, mint az Intelnek. Amikor itt voltak Budapesten, akkor lehetőségem volt beszélni velük, és kérdeztem, hogy miért nem mennek FPGA-ra és más specifikus rendszerre. Ugyan elméleti teljesítményben valóban a CPU-GPU-FPGA-AI jön ki a legjobbra, de a gyakorlatban "programing hell" az egész. Gyakorlatilag tíz évnyi munka volt az, hogy a Linux kernelben lehetőség legyen a GPU-t a CPU-val egy szinten kezelni, de Windowson még mindig nem érték ezt el, noha a Microsoft már erősen dolgozik rajta. Most az FPGA-nál ezt megint újra kell kezdeni. Az Intel viszont most csőlátásban a teljesítményre megy, és abban reménykednek, hogy majd a SYCL segít a programozásban. Igazából a SYCL tud segíteni, tehát nem lehetetlen ez az irány sem.

(#158) frescho: Mindenféle puffer. Ezeket dagasztották meg, hogy két szálra jók legyenek, de ha csak az egyik szál kapta meg őket, akkor sokkal több puffert használt, mint használhatott volna a modulos felépítés nélkül. A feldolgozók valójában nem voltak közösek, annak ellenére, hogy a marketingben ez volt az üzenet.

Annyira eltért a P6 dizájntól, hogy az erre kialakított optimalizálások nem működtek rajta. Ez volt a P4 és a Bulldozer baja is. És, hogy ezt kompenzálják, elkezdték növelni az órajelet, amivel nőtt a fogyasztásuk is. Nem koncepcióból tervezték ezeket zabagépnek, meg futottak bele az órajellimitbe, hanem a körülmények hozták így mindkét esetben. Azért eléggé beszédes, hogy két gyártó úgy dönt, hogy eltávolodik az Intel P6 architektúrájának alapvető koncepciójától, és gyakorlatilag ugyanúgy elhasalnak, lényegében ugyanott (fogyasztásba és órajelfalban). Viszont mindkét gyártó visszatér a P6-szerű dizájnnal és helyből működik. Ennyit számít a szoftverben az optimalizálás. Ezzel persze magukat is szívatják, mert így bizonyos döntésekre vannak kényszerítve. Legalábbis nem hiszem, hogy még egyszer mellékutazik valamelyik cég. :)

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.