Hirdetés

2024. május 2., csütörtök

Gyorskeresés

Téma összefoglaló

Téma összefoglaló

  • Utoljára frissítve: 2023-12-13 04:53:32

LOGOUT.hu

OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!

Összefoglaló kinyitása ▼

Hozzászólások

(#4851) Thrawn válasza fLeSs (#4850) üzenetére


Thrawn
félisten

Ne legyen igazad :)

Zavar, hogy fentről is mennek el a cégtől és nem tudom miért. Persze ha a 10% rájuk is vonatkozik, akkor semmi gond.
Atiq Raza-t csalogassák vissza :U

Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł

(#4852) fLeSs válasza Thrawn (#4851) üzenetére


fLeSs
nagyúr

A vezetést akkor rúgják ki, amikor vmit elbaltázott a cég (fejek hullanak, szokták mondani).
A beosztottakat meg akkor, amikor megszorítások vannak.
Ez mindenhol így van.

[ Szerkesztve ]

"I press keys on a keyboard all day and click a mouse in front of a glowing rectangle. Somehow that turns into food and shelter."

(#4853) Oliverda válasza Rive (#4847) üzenetére


Oliverda
félisten

Ez úgy van ahogy fLeSs is mondja. Valaki(k)nek el kell vinni a balhét ilyet esetekben. Ez minden nagy cégnél így működik. Mellesleg nem hiszem hogy ne lenne bőven utánpótlás a megüresedett pozíciókra.

"Minden negyedik-ötödik magyar funkcionális analfabéta – derült ki a nemzetközi felmérésekből."

(#4854) fLeSs válasza Oliverda (#4853) üzenetére


fLeSs
nagyúr

hát igen.
nem a vezető mérnököket rúgták ki, azokból nincs olyan sok. ;]

"I press keys on a keyboard all day and click a mouse in front of a glowing rectangle. Somehow that turns into food and shelter."

(#4855) Thrawn válasza fLeSs (#4854) üzenetére


Thrawn
félisten

Remélem van azok között olyan képességű, mint Atiq Raza volt :)
Ráférne a cégre, hogy kihúzzanak egy pókert a kabátujjból.

Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł

(#4856) fLeSs válasza Thrawn (#4855) üzenetére


fLeSs
nagyúr

biztosan van ott néhány jóképességű emberke, emiatt nem kell félni.
pókerük viszont nincs, arról már hallottunk volna.

"I press keys on a keyboard all day and click a mouse in front of a glowing rectangle. Somehow that turns into food and shelter."

(#4857) Thrawn válasza fLeSs (#4856) üzenetére


Thrawn
félisten

Az SSE5-öt sem értem teljesen, miért van rá szükség. Lesz olyan program ami használni is fogja? Vagy csak megnézhetjük pl a CPU-Z-vel, hogy jéé van benne SSE5, az Intelben meg csak SSE4.1?

Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł

(#4858) fLeSs válasza Thrawn (#4857) üzenetére


fLeSs
nagyúr

Az SSE5 rengeteg új utasítást tartalmaz (talán 170?), szinte egy komplett új x86. :D Persze nem, mert nincs benne mindenre új utasítás. Elég sok okosság van benne, viszont van vele 2 probléma.

Az egyik, hogy az AMD teljesen önhatalmúlag alkotta meg. Ez csak azért baj, mert az Intel a nagyobb, és a fejlesztők mindig a nagyobb piaci részesedéssel rendelkező gyártó cuccára optimalizálnak. Szóval elég nagy az esélye annak, hogy az SSE5 a 3DNow! sorsára jut.
Megértem őket, próbálnak kitörni az Intel árnyékából, de be kéne látniuk, hogy ilyen piaci pozícióból nem ők diktálnak. Ha huszonx év alatt nem sikerült, akkor most pláne nem fog.

A másik, hogy úgy csinálták meg, mintha "csakazértsem" akarnák támogatni az SSE4-et. Az SSE5 az SSE4-nek csak egy részét tartalmazza, a másik felét meg nem. Ugye ezt nevezzük "részleges" kompatibilitásnak, ekkora idiótaságot nemtom miért követtek el. Csak saját magukkal qrnak ki, mert xy alkalmazásban egy nem támogatott utasítás miatt lassabb lesz a procijuk, mint az Intel procija (az SSE4-ben is vannak okosságok).
A nem teljes kompatibilitás (vagy inkompatibilitás) miatt meg elég sok félreértés származik majd belőle, ez a programozókat is elriaszthatja a használatától (azon felül, hogy nem az Intel csinálta).

[ Szerkesztve ]

"I press keys on a keyboard all day and click a mouse in front of a glowing rectangle. Somehow that turns into food and shelter."

(#4859) Thrawn válasza fLeSs (#4858) üzenetére


Thrawn
félisten

A 64 bites kiterjesztés bejött nekik (thx to Microsoft), a többiben teljes mértékben igazad van.
Na, legyen jó hír is:
IBM finds more performance and less power in 32 nm chips
Már csak ki kell húzniuk addig valahogy, és összerakni valami ütőset :)

Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł

(#4860) shabbarulez válasza fLeSs (#4858) üzenetére


shabbarulez
őstag

Nagy kérdés lesz ennek az SSE5-nek a támogatottsága. Esetleg valaki aki beleásta magát, az milyen eltéréseket lát SSE5 és Intel féle SEE4.1,4.2 valamint az AVX között? Lesznek közös pontok vagy teljesen más irányba indult el a két gyártó és teljes az inkompatibilítás?

Véleményem szerint is a softwaren és a hardwarek támogatottságán fog múlni minden, a nélkül valóban nem lesznek ezek többek mint CPU-Z-s érdekességek. Ilyen fronton az Intel háttere biztos hogy kellő mértékű lesz, kérdés AMD mennyire tudja érvényesíteni magát. NVidia különálló GPGPU szerintem ezen a téren fog elhasalni, hiába lesz benne nagy hw erő, ha sw oldalról nem lesz támogatottság, akkor nem lesz több mint papírnehezék GP szempontból.

Az őszi IDF-en az egyik előadásban volt pár érdekes mondat. Amikor az AVX-ről beszéltek majd később a Larrabeeről akkor igencsak erősen hasonló szöveg ismétlődött, ami erősen arra engedett következtetni hogy a Sandy Bridge és a Larrabee között talán az AVX lesz a közös pont programozás szempontból.

Itt van pár PDF AVX-ről: [link] ebből az derül ki az AVX úgy van tervezve hogy a kezdeti 256 bites szélességről a jővőben tovább lehessen bővíteni 512 és 1024 bitre. A Larrabeeról meg azt tudni hogy igen széles SIMD képességgel fog bírni. Mi van akkor ha mindkettő prociban benne lesz az AVX de Sandy Bridge-ben 256 bites formájában, Larrabeeban meg már 512 vagy 1024 bitesen. Így sw oldalról ez egy jól portolható megoldást jelent majd, főleg Intel Ct párhuzamos sw fejlesztései és compiler megoldásai tükrében amit már jó ideje fejlesztenek Larrabee és gyanítom AVX felé, legalábbis korábbi demonstrációs slideok a nemrég bejelentett AVX után más megvilágításba kerülnek, mert ezek korábban utaltak hasonló 256,512 és 1024 bit széles SIMD képességre.

Kíváncsi leszek Fusionnál ez hogy lesz megoldva, proci oldalon ott lesz az SSE5, de kérdés az APU-k programozása milyen lesz. Marad a hagyományos GPU-s módi vagy lesz-e valami közös pont, ami a sw portolást támogatja,1xűsíti?

(#4861) #95904256 válasza shabbarulez (#4860) üzenetére


#95904256
törölt tag

Érdekes hogy pl. a horizontal add-nál a 128->256 bit szélesítés helyett inkább csak az operandusokat variálták meg, de nem végez több munkát az AVX. ( dest,src->dest helyett src1,src2->dest ) :F

(#4862) VaniliásRönk válasza shabbarulez (#4860) üzenetére


VaniliásRönk
nagyúr

Mi lett volna, ha csak kérdezel, és nem írsz megint Intel marketing-hsz-t? :U

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#4863) Oliverda válasza VaniliásRönk (#4862) üzenetére


Oliverda
félisten

...és ebben a hsz.ben még csak egyszer van benne az IDF szó. :D

"Minden negyedik-ötödik magyar funkcionális analfabéta – derült ki a nemzetközi felmérésekből."

(#4864) slett27


slett27
addikt

Lesúlytó hírek : [link]

"Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD

(#4865) Gyuri27 válasza slett27 (#4864) üzenetére


Gyuri27
félisten

Mondjuk mostanság a marketing náluk enyhén szólva is katasztrófális.

Amd - Radeon - Ryzen

(#4866) slett27 válasza Gyuri27 (#4865) üzenetére


slett27
addikt

Én nem tudom mi lesz, anno amikor csak Duron meg Athlon processzorok voltak, kerestem régi híreket, akkor nem festett ennyire rosszul a kép. Pedig a piaci részesedés az Intelhez képest igencsak csekély volt (3-4-5% :F) szerverpiac nem is volt. Én ezt nem értem..
1300MHz-es Duron úgy ment mint egy 1300-as Pentium III-as és feleannyiba került. Na ez volt a valami. Na de ez már nem tartozik a topichoz.

"Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD

(#4867) Cagm^c


Cagm^c
tag

Nekem a jelenlegi hejzetről az a véleményem, hogy még 1 évet valahogy kihúz az AMD útánna beérnek a fejlesztés alatt álló projectek és az talán stabilizálja őket.
Én a nyáron csakazért is AMD-t fogok venni. Sőt! A kompatibilitás miatt jövőre még egy Sanghaj is bejöhet. Tisztában vagyok vele, hogy az Intel jobb. De az AMD legalább európai. Valamennyire. Ha szerencsénk lesz az EU megvégi valamennyire őket.

(#4868) fLeSs válasza Gyuri27 (#4865) üzenetére


fLeSs
nagyúr

nem csak mostanság, hanem folyamatosan...

"I press keys on a keyboard all day and click a mouse in front of a glowing rectangle. Somehow that turns into food and shelter."

(#4869) HarryPotter


HarryPotter
őstag

Help, please: hogy tudok az overdrive-ban hozzáférni az auto clock opcióhoz? alapból nem negedi, hogy elindítsam, hasonlóan a ccc-hez, de itt nincs lakat, amivel felszabadítom, vagy legalábbis nem látom.

my three wishes to god , the salvation of the souls of mankind , an elevator to heaven and one night with Aphrodite, in no particular order

(#4870) Rive válasza slett27 (#4866) üzenetére


Rive
veterán

Én nem tudom mi lesz, anno amikor csak Duron meg Athlon processzorok voltak, kerestem régi híreket, akkor nem festett ennyire rosszul a kép. Pedig a piaci részesedés az Intelhez képest igencsak csekély volt (3-4-5% :F) szerverpiac nem is volt. Én ezt nem értem..
Azóta a tipikus per/darab haszon eléggé megváltozott az iparágban - ugyanakkor egy-egy új technológia kifejlesztésének és bevezetésének az ára meg eléggé megnőtt. És az Intel átállt a kétéves technológiaváltásra, szóval mindenkinek egyre rövidebb idő alatt kell visszagyűjteni a hasznot.

1300MHz-es Duron úgy ment mint egy 1300-as Pentium III-as
Naaaa! Emlékeim szerint max. úgy, mint egy Celeron. A standard TBird sorozat volt partiban a PIII vonallal.

/// Nekünk nem Mohács, de Hofi kell! /// Szíriusziak menjetek haza!!!

(#4871) slett27 válasza Rive (#4870) üzenetére


slett27
addikt

Valóban, de a TCeleront ütötte. :) Mindegy, lényeg, hogy most nincs akkora különbség, a K10 alapú 9850 is Q6600 árában van, vagy drágább és hát ugye... meglehet nézni a teszteket, nem a SuperPI-t, hanem a valós alkalmazásokat.

"Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD

(#4872) VaniliásRönk válasza Rive (#4870) üzenetére


VaniliásRönk
nagyúr

A Tualatin szériában nem volt difi Celeron és P3 között, az Athlonok pedig megették reggelire a P3-akat, a Willamette P4-ekről meg jobb nem is beszélni. :DDD

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#4873) slett27 válasza VaniliásRönk (#4872) üzenetére


slett27
addikt

...Athlonok pedig megették reggelire a P3-akat, a Willamette P4-ekről meg jobb nem is beszélni. Én ilyet szeretnék mostanában látni, pl : az AMD új 4 magosa 30%-al veri a legtöbb alkalmazásban a Q9xxx processzort. :U

off vége.

"Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD

(#4874) Thrawn válasza fLeSs (#4858) üzenetére


Thrawn
félisten

Heh, nem is olyan újkeletű már ez az SSE5:
A New SSE Instruction Set: AMD Announces SSE5

Érdekes olvasmány, sokmindenre rávilágít.

Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł

(#4875) Telefunen válasza VaniliásRönk (#4872) üzenetére


Telefunen
őstag

Igen erősen visszafogta a tualatin magot az FSB, a 133-as P3-ak jókora előnyben voltak (vagy 20%)

(#4876) VaniliásRönk válasza Telefunen (#4875) üzenetére


VaniliásRönk
nagyúr

Nem tudom feltűnt-e, de a 12x120-ra tuningolt Tualatin cerka sem váltotta meg a világot, gondolod ha még 13MHz-cel nagyobb lett volna az FSB-je, akkor porig alázza a K7-et? :D
Az 512 L2-s szerver változat meg kicsit kilóg a sorból. ;)

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#4877) Telefunen válasza VaniliásRönk (#4876) üzenetére


Telefunen
őstag

Nem az Athlon-okról beszéltem (természetesen azok vitathatatlan fölényben voltak), hanem arra reflektáltam, hogy a tua cel-p3 között nem volt difi.

(#4878) VaniliásRönk válasza Telefunen (#4877) üzenetére


VaniliásRönk
nagyúr

Én meg arra próbáltam rávilágítani, hogy a P3-S előnye nem az FSB-ből adódott, hanem a nagyobb cache-ből.

[ Szerkesztve ]

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#4879) Balala2007 válasza #95904256 (#4861) üzenetére


Balala2007
tag

Tudtommal van 256 bites HADD az AVX-ben.

VHADDPD (VEX.256 encoded version)
DEST[63:0] <- SRC1[127:64] + SRC1[63:0]
DEST[127:64] <- SRC2[127:64] + SRC2[63:0]
DEST[191:128] <- SRC1[255:192] + SRC1[191:128]
DEST[255:192] <- SRC2[255:192] + SRC2[191:128]

VDPPD-bol viszont tenyleg nincs 256 bites

AIDA64.com

(#4880) Balala2007 válasza shabbarulez (#4860) üzenetére


Balala2007
tag

AVX vs. SSE5 ahogy en most latom

(szigoruan elso benyomasok, lehetnek benne sulyos felreertesek, raadasul erosen szubjektiv is)

- SSE5 nem definial uj architekturalis allapotot, a meglevo 8 ill. 16 SSE regisztert hasznalja, nem kell hozza a meglevo OS-eket patchelni. Az AVX nagyobb regiszterteret hasznal (YMM regiszterek) ezek mentesehez bele kell piszkalni az OS-ekbe. Ez a 256 bites regiszterek nyilvanvalo hatranya. A helyzet analog az SSE vs. 3DNow! helyzettel kb. 10 evvel ezelott.
- SSE5 ortogonalis, azaz a regiszterek teljesen egyenranguak, minden mindenhol hasznalhato. Az x86 egyik fo baja amugy is a dedikalt regiszterhasznalat, marmint bizonyos muveletek kotelezoen megadott a regisztereket hasznalnak (pl. full MUL eseten eredmeny mindig rAX:rDX-ben, stb.) Ez egy rakas plusz mozgatast igenyel a kodban. Az SSE1,2,3, SSSE3 ugyan ortogonalis, de az SSE4 mar nem, abban az xmm0-nak kiemelt szerepe van. Az AMD cuccai ebben sokkal jobbak, az SSE5, a 3DNow! es a TFP (Technical Floating Point, piacra nem kerult, de az opkodok megtekintenthetok itt: http://www.sandpile.org/ia32/opc_k3d.htm) 100% ortogonalisak.
- Az AVX a boviteseket a 2 vagy 3 byte-os VEX prefixszel vezeti be, helyettesitve az SSE ill. REX prefixeket, emiatt az atlagos AVX utasitasok vszeg hosszabbak lehetnek az SSE5-os megfeleloiknel. Nem lepodnek meg, ha legkesobb a Sandy Bridge-ben a 16 byte-os Ifetch ablak 32 byte-ra novekedne.
- Az AVX onmagaban csak az alap float es double tipusokra vonatkozik. Egyreszt kiszelesednek a regiszterek 128-rol 256 bitre, masreszt lehetoseg nyilik 3 operandusos muveletekre. SSE1,2,3,SSSE3,SSE4.1 lebegopontos muveletei 2 operandusosak, az egyik forrast az eredmeny mindig felulirja. src,dst->dst helyett src1,src2->dst, ez mar nagyon kellett.
- Az AVX nem foglalkozik egesz tipusokkal 256 biten.
- Az SSE5 komoly egesz tipus tamogatassal rendelkezik. Rendre byte, word, dword, qword-re is ki vannak dolgozva a horizontal ADD/SUB, MADD, shift, rotalas muveletek, nagyon elegans es teljesen szimmetrikus.
- Az SSE5 permutalo utasitasai sztem kulon tapsot erdemelnek. Pl. a PPERM egymagaban tobbet tud, mint az osszes Inteles MOV/PACK/UNPCK. Ehhez kepest az Intel megoldasa enyhen szolva trehany.
- Az AVX csak az egyik a most bejelentett 4 fele fuggetlen Inteles utasitaskeszlet bovites kozul. A Nehalemekben ezekbol meg egy sem lesz benne, a Westmere-ben lesz HW AES tamogatas, a tobbi egyelore kerdojeles.
- Az AVX nem tartalmazza az igazan nagy ujitast, az FMA-t (fused multiply-add). Ez egy utasitasban egyesiti a szorzast es az azt koveto osszeadast, mikozben az utasitas latency tipikusan nem nagyobb a sima szorzasnal. Az Intel az SSE4.1 probalkozott valamit a DPPS/DPPD-vel, de az a gyakorlatban nem mutat igazi elonyt, az csak valamilyen mikrokodos varazslas.
- Az Intel az AVX-tol fuggetlenul definialta a sajat 4 operandusos FMA supportjat az YMM regiszterekre. Az egyelore nem vilagos, hogy mikor kerul implementalasra.
- Az Intel FMA-ban van kevert ADDSUB ill. SUBADD-os verzio is, azaz az FFT butterfly muvelete 1 utasitasra egyszerusodhet.
- Az SSE5 tartalmaz egy olyan FMA supportot, aminek az a hatranya van az Intelehez kepest, hogy csak virtualisan 4 operandusos. Az dst = op1 * op2 + op3 muvelethez teljes megvalositasban 4 fuggetlen regiszter kellene, az SSE5-ben viszont a dst sajna az egyik az op1, op2, op3 kozul.

Tomoren: sztem az SSE5 a maga korlatai kozott atlathatobb, szimmetrikusabb, kovetkezetesebb (es talan konnyebben hasznalhatobb is lenne), mint a (sztem szokasosnak mondhato) Inteles takolas, de nem hinnem, hogy valaha is piacra kerul. :( Az AMD sztem a "koszonjuk a reszvetelt" fazisban van, mert a jovendobeli sikereihez nem csak onmagaban kellene jol teljesitnie, hanem az Intelnek is rosszul.

AIDA64.com

(#4881) fLeSs válasza Balala2007 (#4880) üzenetére


fLeSs
nagyúr

A Bulldozerben lesz SSE5, addig biztosan élni fog az AMD.

"I press keys on a keyboard all day and click a mouse in front of a glowing rectangle. Somehow that turns into food and shelter."

(#4882) #95904256 válasza Balala2007 (#4879) üzenetére


#95904256
törölt tag

Tudtommal van 256 bites HADD az AVX-ben.
VHADDPD (VEX.256 encoded version)
DEST[63:0] <- SRC1[127:64] + SRC1[63:0]
DEST[127:64] <- SRC2[127:64] + SRC2[63:0]
DEST[191:128] <- SRC1[255:192] + SRC1[191:128]
DEST[255:192] <- SRC2[255:192] + SRC2[191:128]
VDPPD-bol viszont tenyleg nincs 256 bites

Erre mit mondjak? Úgy érzem magam mint akinek tudathasadása van.

Teljesen az rémlik hogy mikor néztem a a VHADDPx-nél DEST[255:128] (unmodified) volt írva, viszont a VDPPD-nél 256 bites volt az osztás! Ez utóbbi épp ez miatt nem is említettem. Ráadásul abban is biztos vagyok hogy nem kevertem össze a két utasítás mnemonikját...

szerk.: Természetesen az előbb letöltöttem az Intel doksit és úgy van benne ahogy írtad.

[ Szerkesztve ]

(#4883) slett27 válasza #95904256 (#4882) üzenetére


slett27
addikt

Valójában milyen programokat írtok ? :B

"Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD

(#4884) #95904256 válasza slett27 (#4883) üzenetére


#95904256
törölt tag

Valójában milyen programokat írtok ?

Elég meglepő kérdés. Nem is értem teljesen.

Ha az előbbi pár hozzászólás kapcsán kéred, akkor ahhoz csak annyit tudok hozzáfűzni hogy hobbiból foglalkozom assembly-vel. Különösen érdekel hogy mit lehet kifacsarni egy-egy arhitektúrából. ( Pl. a Max Planck kutatóintézet még fizet is azért hogy optimalizált kódot írjak nekik ahelyett hogy egy újabb, gyorsabb clustert állítsanak hadrendbe. Szóval, még meg is éri. :D )

Ha munkával kapcsolatosan kérded, akkor meg ipari titok. ;)

[ Szerkesztve ]

(#4885) slett27 válasza #95904256 (#4884) üzenetére


slett27
addikt

Akkor elég komolyan űzöd ezt ! :) Én Delphi-ben tanultam... "programozni". :D

"Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD

(#4886) Thrawn


Thrawn
félisten

Shanghai is currently taped out and running Windows at AMD.

6 mag, 8 mag és más finomságokról is szó van :)

Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł

(#4887) P.H. válasza Balala2007 (#4880) üzenetére


P.H.
senior tag

Még nem néztem bele az AVX doksiba, de amit leírtál, arról ezek jutottak eszembe (csak a bekezdések elejét idézem, remélem, nem zavaró):

- ("SSE5 nem definiál uj architekturalis allapotot"...) a kérdés, az OS-gyártók (pl. a Microsoft) mennyire fog az AVX mellé állni, gondolok itt arra, mennyire fog visszamenni - Win98? WinME? Win2K? WinXP? Vista? - a patch-csel. Az SSE5 minddel használható lesz.

- ("SSE5 ortogonalis, azaz a regiszterek"...) az x86 egyre inkább arra haladt, hogy ortogonális megoldást adjon szinte minden korábbi register-specifikus megoldásra. Nem tudok indokot találni arra, miért jó visszatérni ehhez a szemlélethez. :(

- ("Az AVX a boviteseket a 2 vagy 3 byte-os VEX"...) az AMD elég korán elkezdte használni az 0F0Fh prefixet, az Intel a REP/REPNZ és az adatméretváltó byte-okat erőltette eddig. Szerintem ennek inkább decode-egyszerűsítési és valamilyen jövőbeli kiterjeszthetőségi okai vannak. Logikus, bár áldozattal jár.

- ("Az AVX onmagaban csak az alap float és"...) érdekes. Az általános, hétköznapi CPU-orientált média(/image)-alkalmazások inkább felszorzott integer adatokon dolgoznak, ahogy eddig láttam (bár mondjuk én jobban szeretem az fp-megközelítést). Talán az Intel minőségi okok miatt nem erőlteti az integer-t (DCT/IDCT, átméretezés, stb) a nagyobb adatmennyiségen dolgozó algoritmusoknál; kb. ott lehet sebességben így (jobb minőség mellett), mint a kisebb méretű integer-utasításokkal.

- ("Az SSE5 tartalmaz egy olyan FMA supportot, aminek az a hátránya"...) 16-os register-készletre nem hiszem, hogy célszerű alkalmazni valódi négyoperandusos műveleteket (több memóriaoperandus pedig kényszerűen megnöveli pl. az utasítás méretét).

[ Szerkesztve ]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#4888) leviske válasza Balala2007 (#4880) üzenetére


leviske
veterán

Azért még nem kell annyira temetni az AMD-t...

Nem azt ondom, hogy hűűűdeha lefogja előzni az Intelt már a jövő hónapban, de kitudja húzni azért egy darabig. Főleg, ha már sikerül átálnia 45nm-re. (szvsz) :)

(#4889) #95904256 válasza leviske (#4888) üzenetére


#95904256
törölt tag

Az AMD-nek a processzorok területén érdemben csak az Intel-lel, GPU-k területén meg az nVidia-val kell versenyezni. Nem tudom elképzelni hogy egy ilyen pár szereplős piacon ne lenne jelentősebb az árrés a termékeken mint egy olyan területen ahol sokkal több a piaci résztvevő ( nagyobb a verseny ). Az AMD ennek ellenére folyamatosan képes veszteséget termelni ( ATI előtt és után ). Reméljük a 10%-os elbocsátás és egyéb kiadás csökkentések mellett újra pozitív lesz a mérlege. Végülis, jobb esélye van rá mint ha más területen tevékenykedne. Szvsz. szerintem sem kell temetni, bár lehet hogy cserélhetnék a gazdasági tiszteket. ;)

(#4890) VaniliásRönk válasza #95904256 (#4889) üzenetére


VaniliásRönk
nagyúr

Ha ők adnának el 2-3x annyi CPU-t/GPU-t, nem pedig a versenytársak, akkor simán nyereségesek lennének...

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#4891) #95904256 válasza VaniliásRönk (#4890) üzenetére


#95904256
törölt tag

Ezt mi alapján mondod?

Pl. a BKV is egyeduralkodó a maga területén, mégis az én zsebemből (is) akarják kompenzálni a veszteségét... :DDD

(#4892) Balala2007 válasza Balala2007 (#4880) üzenetére


Balala2007
tag

Nem tudom mennyire uj info, de itt vegre megirtak, hogy a Shanghaiban semmi architekturalis ujitas nem lesz a 6MB L3-on kivul. Semmi SSSE3, semmi SSE5, felesleges remenykedni. Vszeg az L3 latency-nek sem fog jot tenni a nagyobb meret es a nagyobb (32 vs. 48) asszociativitas. A magasabb freq-ban meg lehet remenykedni. ;]

AIDA64.com

(#4893) VaniliásRönk válasza Balala2007 (#4892) üzenetére


VaniliásRönk
nagyúr

Ebben a cikkben nem mennek bele részletekbe, finomítások biztosan lesznek, egy sima steppingváltásnál is mindig vannak.

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#4894) zsolt320i válasza slett27 (#4873) üzenetére


zsolt320i
senior tag

Ya Én is ezt szeretném!!!!

(#4895) #95904256 válasza Balala2007 (#4892) üzenetére


#95904256
törölt tag

Van valahol részletesebb infó a Shanghai-ról, pl. hogy 48 utas lesz az L3?

Amennyiben nő az asszociativítás, biztosra vehető hogy a késleltetés is növekszik. Bár ez a plusz órajel az L3/RAM esetében nem jelentős. Az Intel Penryn procijainál is ez történt, igaz ott az L2-vel...

(#4896) P.H. válasza #95904256 (#4895) üzenetére


P.H.
senior tag

Azt hiszem, volt erről forrás is, de logikailag is szükségszerű: a fizikai címből eggyel több bitet használnak fel az L3 indexelésére, ekkor kijön 4 MB, és másfélszeresére növelik az asszociativitást, így jön ki a 6 MB.

A K8-as L2 esetén a fizikai címből jövő indexelő bitek számával játszottak (ennek a hibaleírásnak a 6. pontjában konkrétan le is írják ezt), az asszociativitás nem változott 256-512-1024 KB L2 esetén, a Core2-nél viszont fordítva van, azt hiszem: ahogy csökken a családok L2-mérete, annál kisebb az asszociativitás.

[ Szerkesztve ]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#4897) #95904256 válasza P.H. (#4896) üzenetére


#95904256
törölt tag

Utánanéztem az inteles dolognak. Nem kicsit meglepett a dolog.

L2 cache méret / asszociativítás Core2 magos processzoroknál:

Celeron E1xxx: 512kB / 2 utas :Y
Pentium Dual-Core E2xxx: 1MB / 4 utas
Core2Duo E4xxx: 2MB / 8 utas
Core2Duo E6xxx: 4MB / 16 utas

(#4898) P.H. válasza #95904256 (#4897) üzenetére


P.H.
senior tag

Penryn: 6 MB / 24 utas :)

Már csak egy teszt hiányzik, hogy ez az asszociativitás-változás mennyiben befolyásolja a késleltetést náluk (sejtem, nem sokban: az asszociativitás elméletileg párhuzamos hozzáférést feltételez).

[ Szerkesztve ]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#4899) #95904256 válasza P.H. (#4898) üzenetére


#95904256
törölt tag

A Kentsfield-nél ( 4MB / 16 utas ) 14 órajel a késleltetés.
A Penryn-nél ( 6MB / 24 utas ) 15 órajel.

Ebből akár az is kisülhet hogy azonos órajelen egy E1xxx Celeron a 11(?) órajeles késleltetésével 35%-kal gyorsabban is futtathat bizonyos alkalmazásokat mint a Penryn. :K

Persze ritka az efféle alkalmazás ( pl. különböző feladvány megoldó programok ( sakk, sudoku, maze solverek ) ), inkább a cache mérete a domináns.

(#4900) P.H. válasza #95904256 (#4899) üzenetére


P.H.
senior tag

Ha valóban ekkora (órajelekben mérhető) hatása van a késleltetésre önmagában az asszociativitásnak (és most csak maradjunk a Merom-családon belül, ott igazán érdekes a kérdés, főleg visszafelé), akkor az E1xxx-es felvetés jogos is lehet - bár én nem hiszem.

De azt se feledjük, hogy itt (Barcelona-Shanghai esetén) cache-növekedésről is beszélünk, magasabb asszociativitás mellett (meg még esetleges órajel-változásról is).

[ Szerkesztve ]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

Copyright © 2000-2024 PROHARDVER Informatikai Kft.