Hirdetés

2024. május 1., szerda

Gyorskeresés

Téma összefoglaló

Téma összefoglaló

  • Utoljára frissítve: 2023-12-13 04:53:32

LOGOUT.hu

OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!

Összefoglaló kinyitása ▼

Hozzászólások

(#1251) ftc válasza Oliverda (#1249) üzenetére


ftc
nagyúr

Az a gondom ,hogy can hit elérheti...de nem fogja 65nm-n sztem nem.Elég komplex már a chip és mind a 4 magnak annyin kéne futkosnia...

(#1252) Oliverda válasza ftc (#1251) üzenetére


Oliverda
félisten

A can az annyit jelent hogy képes rá, tehát eléri, ha igaz a hír.

"Minden negyedik-ötödik magyar funkcionális analfabéta – derült ki a nemzetközi felmérésekből."

(#1253) Mackósajt válasza Oliverda (#1252) üzenetére


Mackósajt
senior tag

A ''can'' sokkal valószínűbben jelenti azt, hogy egyes példányok felhúzhatók odáig. Vagyis, ha tuningolsz, és szerencséd van, akár lehet is ilyened. Azt, hogy ilyen garantált órajele lenne, nem jelenti, akkor nem lenne benne ez a lehetőséget jelző szócska.

Nem mintha ez számítana, kedvenc hírhordárunk bizonyára most is csak találgat.

(#1254) keIdor válasza Oliverda (#1247) üzenetére


keIdor
titán

Akkor ott már valóban jó esélyekkel indúl a Penryn 3,33GHz ellen, persze kérdéses, hogy az Intel tuningja meddig megy majd el...

Yorkfield 4GHz már kicsit durva lenne! ;]

¡GLORIA A LAS PLAGAS!

(#1255) Oliverda válasza Mackósajt (#1253) üzenetére


Oliverda
félisten

Én sem hiszem hogy lesz olyan AMD által kiadott 4 magos verzió ami 3.0+ GHz felett üzemelne alapból, viszont ha a jobbakat fel lehet majd 3.2-3.3-ra húzni az azért már nem lenne rossz.

"Minden negyedik-ötödik magyar funkcionális analfabéta – derült ki a nemzetközi felmérésekből."

(#1256) Hakuoro válasza MoonLord (#1245) üzenetére


Hakuoro
aktív tag

Enyire hogy tudtál eltévedni :Y :DDD ;]
Egyébként jó lenne ha kicsit csipkedné magát az AMD :U bár biztos méregdrágák lesznek ezek a procik. Nekem egy 2magos 2,4Ghz Phenom X2 25-30k-ért már megérné :DDD

[Szerkesztve]

(#1257) Andre1234 válasza Hakuoro (#1256) üzenetére


Andre1234
aktív tag

kinek nem???? :DD :DD :DD :DD

[Szerkesztve]

Ha x tart végtelenbe, akkor a prímek reciprok szorzatának negáltja 0-hoz tart...

(#1258) Yutani


Yutani
nagyúr

Én abban reménykedem, hogy a az új Phenom X2 lesz olyan jó, mint a mostani C2D procik, és így lesz alternatíva AM2-re a C2D ellenében teljesítmény szempontjából.

#tarcsad

(#1259) VaniliásRönk válasza Yutani (#1258) üzenetére


VaniliásRönk
nagyúr

Most is van ember. :W A userek 90%-a nem tuningol, és E6600/6000+-nál nagyobb CPU-t se sokan vesznek, de ugye te is csak azt nézed ki éppen a ''King of the hill'', tipikus fogyasztó. :P

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#1260) Hakuoro válasza VaniliásRönk (#1259) üzenetére


Hakuoro
aktív tag

Én pl a 10%-ban vagyok még a mostani 850-es duronom is 1000ren megy :DDD
Durva proci mi és AMD :P

(#1261) Hun'reeth válasza VaniliásRönk (#1259) üzenetére


Hun'reeth
őstag

Szerintem Te pontosan érted Yutani mire gondolt. Felesleges ez. ;]

Én csak örülök a 3 GHz-es K10-nek meglátjuk mit nyújt majd és mennyibe kerül.


[Szerkesztve]

''Öregember nem gyorsvonat!''

(#1262) VaniliásRönk válasza Hun'reeth (#1261) üzenetére


VaniliásRönk
nagyúr

Nem, nem értem, általánosságban beszélt nem a saját vagy más tuningos lelkületű emberek nevében.

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#1263) Raymond válasza VaniliásRönk (#1262) üzenetére


Raymond
félisten

Arrol beszelt hogy eleri a C2D IPC-jet barmilyen feladatban igy ugyanazon orajelen legalabb olyan gyors vagy jobb lesz. Nem arrol hogy van e K8 XY aron es magasabb orajelen ami eleg gyors egy kisebb orajelu C2D-nel vagy nem. Hagyd ezt a fanboy szerencsetlenkedest, semmi ertelme.

[Szerkesztve]

Privat velemeny - keretik nem megkovezni...

(#1264) #95904256 válasza Raymond (#1263) üzenetére


#95904256
törölt tag

Ha jól sejtem ezek az IPC maximális értékei:
K8: 3,0
Core2: 4,0
K10: 3,0

(#1265) R.Zoli


R.Zoli
őstag

Szerintem a 3,24 Ghz az ilyen extreme edition formájában nagyon kis számban létező verzió lehet majd...Biztos ,hogy nem arról írnak ,hogy otthon sufni tuninggal mennyit tudsz kihajtani mert az kit érdekel egy hivatalos termék szempontjából....

Amit sokan elfelejtenek,hogy komplex a chip DE ott a SOI ami ugye a ''hagyományos'' gyártástechnologiához képest +15-20%-kal nagyobb órajelet biztosít...

sok szakértő nyilatkozott már és ők is azt állították ,hogy 3Ghz-et biztosan el kell érnie a K10-nek... És ezt olyanok mondták akik értenek is hozzá...


A jelenlegi 2 Ghz-es Barcelonákról meg annyit ,hogy a legelső stepping az ami 2Ghz-en fut...A Phenom X4 a legújabb steppingre épül...A legelső steppinggel legyártott procikat is el kell adniuk és erre van beállítva egy gyártósor, változtatni sem egyszerű és valszeg a nyitásra azt szeretné az AMD ,hogy ne csak paperlaunch legyen így míg az első steppinges Barcelonák már több hónapja a gyártósoron vannak a Phenomokból csak most kerülnek majd valamikor az első példányok a gyártósorra...

Jah az meg a másik ,hogy a Barcelona tudtommal egy halom olyan dolgot nem tud power managment terén ami a magas órajelet segítené, ezért is lehet ,hogy jóval alacsonyabb órajelen indul... Az igazi procik a Phenomok lesznek itt lesz már ,hogy minden mag külön feszelhető, IMC is stb...

(#1266) VaniliásRönk válasza Raymond (#1263) üzenetére


VaniliásRönk
nagyúr

Azért ennyire ne nézz a sorok közé, semmit nem írt le abból amit emlegetsz.

Te meg hagyd abba a minősítgetést, annak sincs értelme.

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#1267) Raymond válasza VaniliásRönk (#1266) üzenetére


Raymond
félisten

Nem a sorok kozott olvasok, csak nem hordom a fanboy szemuveget. Azt irta kell neki egy alternative teljesitmeny szempontjabol es per pillanat a K8 nem az. A leggyorsabb 3.0Ghz-s 6000+ gyakorlatilag a 2.4Ghz-s E6600-al van pariban. Es a C2D-bol is van 3Ghz verzio. Tehat AM2-n teljesitmeny szempontjabol alternativa nincs. Ennek semmi koze sem ahoz mit vesz a legtobb ember sem a tuninghoz mint ahogy felhoztad. Ennyi.

Privat velemeny - keretik nem megkovezni...

(#1268) #95904256 válasza R.Zoli (#1265) üzenetére


#95904256
törölt tag

Hali R.Zoli!

Hol lehet ilyesmi infókat fellelni hogy mik lesznek a különbségek a Barcelona és Phenom processzorok közt?

(#1269) VaniliásRönk válasza Raymond (#1267) üzenetére


VaniliásRönk
nagyúr

Te épp az ''én jobban tudom'' szemüveget viseled, és mindenáron ki akarsz okatatni.
A teljesítmény nem teljesítmény/clock, attól meg hogy aki a leggyorsabbat keresi az az Intelnél nézelődik még nem jelenthető ki általánosan, hogy az AMD az nem alternatíva, attól függ mennyit szánhatsz ilyen célra. Ennyi.

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#1270) Raymond válasza VaniliásRönk (#1269) üzenetére


Raymond
félisten

Egye fene regen volt mar itt ez....

''attól függ mennyit szánhatsz ilyen célra''

Meg egyszer - penzrol nem volt szo. Arrol volt szo van e teljesitmenyben alternativa AM2 platformon a C2D-hez. Es nincs. A teljesitmeny/clock ott jon a kepbe hogy a C2D ugyanazon az orajelen gyorsabb mint a K8, tehat az uj chip-nek fel kell zarkoznia itt de inkabb lehagyni a C2D-t realisan elerheto (valos programok) IPC-ben.

Privat velemeny - keretik nem megkovezni...

(#1271) VaniliásRönk válasza Raymond (#1270) üzenetére


VaniliásRönk
nagyúr

Miért akarod leszűkíteni a kérdést a leggyorsabb CPU-ra? Hol olvastad a maximum szót? Egy Sempron vagy egy Celeron esetében nem beszélhetünk teljesítményről?

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)

(#1272) Hun'reeth válasza VaniliásRönk (#1271) üzenetére


Hun'reeth
őstag

Feleslegesen lovagolsz olyan dolgokon amikről tudod, hogy nem volt szó. Igazából tudod, hogy Yutani pont azt mondta amiről Raymond is írt miért kell ezekkel foglalkozni? :U Teljesen felesleges.

''Öregember nem gyorsvonat!''

(#1273) Raymond válasza VaniliásRönk (#1271) üzenetére


Raymond
félisten

Nem szukitek le semmit. Az eredeti hsz azt mondta ''jo lenne a C2D-hez valami AM2 alternativa teljesitmeny szempontjabol'' es ez azt jelenti jo lenne valami ami ugyanolyan gyors vagy gyorsabb. Per pillanat nincs. Remelhetoleg a K10 az lesz. Ne keverj ide Sempronokat meg Celeronokat. Ha az erdekelne akkor nem a teljesitmenyt emelte volna ki hanem az arat vagy az ar/telejsitmeny aranyt. Hiaba az erzelmi beallitottsagod az AMD irant a tenyeken nem valtoztatsz.

Privat velemeny - keretik nem megkovezni...

(#1274) dezz válasza #95904256 (#1264) üzenetére


dezz
nagyúr

''Ha jól sejtem ezek az IPC maximális értékei:
K8: 3,0
Core2: 4,0
K10: 3,0''


Erről már beszéltünk. Ez így helytelen. Az AMD-nél ez (AMD-féle) makroOP-okban értendő, Intelnél meg mikroOP-okban. Namost az alap gépi kód AMD-nél általában 1db (AMD-féle) makroOP-ra fordul, Intel esetén viszont általában 2 mikroOP-ra. Így az Intel-féle mikroOP fúzió nélkül a Core2 2,0-ra jön ki, azzal együtt meg kb. egálban vannak.

[Szerkesztve]

(#1275) #95904256 válasza dezz (#1274) üzenetére


#95904256
törölt tag

Hali dezz!

Igazad van, legalábbis részben. Tényleg nem jó a 4,0 érték.

Core2: 6,0 ( mikroOP fúzióval )
Core2: 5,0 ( mikroOP fúzió nélkül )

szerk.: Beszéltünk róla, de úgy látom még sincs egálban...

[Szerkesztve]

(#1276) #95904256 válasza #95904256 (#1275) üzenetére


#95904256
törölt tag

Ez az infó nem megbízható.

szerk.: elvileg 6 port van, de kizárt hogy mindegyik leterhelhető egyszerre

[Szerkesztve]

(#1277) P.H. válasza #95904256 (#1275) üzenetére


P.H.
senior tag

(Az első fele törölve :) )

Én azon gondolkodom egy ideje, hogyan lehet az, hogy a Core microarchitecture miért nem mutat kétszeres feletti gyorsulást (illetve, hogy a K8 miért nem szakadt jobban le tőle, hiszen nem csak 64->128 volt ott a korábbiakhoz képest). Mi fogja vissza ennyre? Vagy mi nem volt ismert a korábbiakról? Mert az, ami visszafogja, az AMD-t is komolyan érintheti.


[Szerkesztve]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#1278) #95904256


#95904256
törölt tag

Na, végülis kicsit megkavarodtam, így a tisztánlátás végett átnéztem az idevágó Intel dokumentációt. ( 248966 - Intel 64 and IA-32 Architectures Optimization Reference Manual ).

Ott ez szerepel:
All of the decoders can decode one macro-fused pair per cycle, with up to three other instructions, resulting in a peak decode bandwidth of 5 instructions per cycle.

Ez egyértelmű. Maximálisan 5-ös IPC érthető el. De ez nagyon elméleti... :)

[Szerkesztve]

(#1279) #95904256 válasza P.H. (#1277) üzenetére


#95904256
törölt tag

Hali P.H.!

Ez engem is érdekel. Ugyanis többször próbáltam már különféle kódokat optimalizálni a különféle manual-ok alapján, mégis irgalmatlanul nehéz az IPC = 1,5-ös értéket megközelíteni. Sőt, sokszor 0,8-0,9 környéki értékek jönnek ki, a vTune-nal is.

Mondjuk az rendben van hogy ezek nem milliószor ciklusban végrehajtott kódok, meg nem is férnek be a ROB-ba ( ICU-ba ). De akkor is... kíváncsi vagyok a K10 féle retirement keresztmetszet növekedésre. :)

(#1280) P.H. válasza #95904256 (#1279) üzenetére


P.H.
senior tag

Ahogy írtad korábban, hogy maga a forrásbeli utasítássorrend kevésbé befolyásolja a K8-at, mint a Core microarchitecture-t, én ütemezésbeli erőtlenségre (''sokszor 0,8-0,9 környéki értékek jönnek ki, a vTune-nal is'') vagy (esetleg, kérdőjelesen) valami retirement-szűkösségre (ilyesmit dezz is linkelt korábban) tudok gondolni, de ezzel ki kellene várni a K10 megjelenését és teljesítményét, abból a realitások talaján talán több kikövetkeztethető.

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#1281) #95904256 válasza #95904256 (#1278) üzenetére


#95904256
törölt tag

Eddig 4,67-es IPC-t sikerült kicsikarni az alábbi kóddal:

cycle:
movq mm0,[esi]
addps xmm0,xmm0
xorps xmm1,xmm1
dec ebp
movq mm1,[esi]
addps xmm2,xmm2
xorps xmm3,xmm3
test edi,edi
jne cycle
movq mm2,[esi]
addps xmm4,xmm4
xorps xmm5,xmm5
test ebp,ebp
jnz cycle


[Szerkesztve]

(#1282) P.H. válasza #95904256 (#1281) üzenetére


P.H.
senior tag

Eredendően értelmetlen kóddal nem nehéz.

cycle:
movq mm0,[esi] //MM0 <- 64 bites értéket kap
addps xmm0,xmm0 // XMM0 <- megkétszereződik
xorps xmm1,xmm1 //<- XMM1 <- 0
dec ebp // <- EBP csökken (de miért)
movq mm1,[esi] //<- MM1 <- azonos MM0 tartalmával
addps xmm2,xmm2 // <- XMM2 megkétszereződik
xorps xmm3,xmm3 // <- XMM3 <- 0
test edi,edi // EDI tesztje (mi csökkenti? végtelen ciklus vagy 0 volt?)
jne cycle // ciklus vége
movq mm2,[esi // MM2 <- mint MM0
addps xmm4,xmm4 // XMM4 kétszeres
xorps xmm5,xmm5 // XMM5 <- 0
test ebp,ebp // válzotó(?)-teszt
jnz cycle // ciklus vége [/OFF]

[Szerkesztve]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#1283) P.H. válasza P.H. (#1282) üzenetére


P.H.
senior tag

Arra, hogy ilyen összecsapott lett a kódértelmezés, egyetlen mentségem, hogy már a [MOD] után született
XOR(/PS/PD)-t meg tényleg hagyjuk ki belőle, P2 óta tudja, hogy nem függ az előző értéktől.

És ez nem tárol eredményt, mindig ugyanonnan olvas (= nem függ a ciklusváltozótól sem a forrás-, sem a céladat címe)


[Szerkesztve]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#1284) #95904256 válasza P.H. (#1283) üzenetére


#95904256
törölt tag

Jó, akkor most mutasd meg te hogy hogy lehet elérni az IPC=5,0 értéket.
Na és persze csináljon valami hasznosat is, ha már tőlem elvárnád. :)

(#1285) dezz válasza #95904256 (#1275) üzenetére


dezz
nagyúr

Egyre rosszabb. ;) Mondom, ez az 5,0-ás és 6,0-ás érték mikroOP. 1db alap x86/stb. utasítás általában 2db mikroOP-ra fordul, amiből egyes párok fúzionálhatnak. Tehát:

Core 2-nél:
6,0 mikroOP -> 3,0 instruction
5,0 mikroOP -> 2,5 instruction

K8/K10-nél:
3,0 (AMD-féle) makroOP -> 3,0 instruction
(+ K10-nél több utasítás DirectPath)

(#1286) P.H. válasza #95904256 (#1284) üzenetére


P.H.
senior tag

Azt hiszem neked kelllene mutatni IPC értéket értelmes kódban.

Én nem montam sehol, hogy 3 feletti IPC-t el lehet érni AMD-kkel. Csak azt ,hogy hogyan lehet velül 3-as IPC elérni.

[Szerkesztve]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#1287) #95904256 válasza P.H. (#1286) üzenetére


#95904256
törölt tag

Miért is?

(#1288) P.H. válasza #95904256 (#1287) üzenetére


P.H.
senior tag

De mondtam, sorry: [link] És tartom is.De 5 vagy 6 IPC-ről szó sem esett eddig.



[Szerkesztve]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

(#1289) dezz válasza #95904256 (#1278) üzenetére


dezz
nagyúr

Nézd meg csak ezt: [link]

Itt 4 mikroOP széles ''csatorna'' látható, és tesztek szerint ebből 1 lehet fúzionált, azaz 4 v. 5 mikroOP mehet át, ami 2,0 v. 2,5 x86/stb. utasítás.

És amikor ezt összehasonlítod a K10 ide vonatkozó csatornájával, ami 3 szintén ''uop''-nak van jelölve, vedd figyelembe, hogy az valójában nem mikroOP ott, hanem AMD-féle makroOP, ami egyenként 2db mikroOP. (Ez a nem teljesen korrekt jelölés fel lett róva a szerzőnek, írta is, hogy talán módosítania kellene a képen, de végül nem foglalkozott vele tovább.)

[Szerkesztve]

(#1290) #95904256 válasza dezz (#1285) üzenetére


#95904256
törölt tag

Hali dezz!

Mi az ami egyre rosszabb?
Idézem még egyszer ami pár sorral feljebb a #1278-ban is olvasható.

All of the decoders can decode one macro-fused pair per cycle, with up to three other instructions, resulting in a peak decode bandwidth of 5 instructions per cycle.

Remélem most jobban látszik.

(#1291) #95904256 válasza P.H. (#1288) üzenetére


#95904256
törölt tag

Az 5-ös IPC a Core2 maximuma. Ez az Intel dokumentációból látszik.
Mikor 6-os IPC-ről beszéltem, az egyértelműen téves információ volt.

Kezdesz összezavarni. Nem értem hogy mire vonatkozik a ''De mondtam...''.
A linkelt hozzászólás most mire vonatkozik?

(#1292) dezz válasza #95904256 (#1290) üzenetére


dezz
nagyúr

Légyszives nézd meg a linket, hogy mit értettem a ''csatornán'', és értsd meg, hogy a dekódolás szélessége önmagában nem döntő tényező.

(#1293) #95904256 válasza dezz (#1289) üzenetére


#95904256
törölt tag

Ezek remek ábrák!

dezz:Itt 4 mikroOP széles ''csatorna'' látható, és tesztek szerint ebből 1 lehet fúzionált, azaz 4 v. 5 mikroOP mehet át, ami 2,0 v. 2,5 x86/stb. utasítás.

A 4/5 mikroOP bizony jelenthet 4/5 utasítást is a Core2 esetében, ugyanis az utasítások jelentős részénél 1 utasítás = 1 mikroOP megfeleltetés áll fenn, ha nincs memória hivatozású operandus.

dezz:És amikor ezt összehasonlítod a K10 ide vonatkozó csatornájával, ami 3 szintén ''uop''-nak van jelölve, vedd figyelembe, hogy az valójában nem mikroOP ott, hanem AMD-féle makroOP, ami egyenként 2db mikroOP. (Ez a nem teljesen korrekt jelölés fel lett róva a szerzőnek, írta is, hogy talán módosítania kellene a képen, de végül nem foglalkozott vele tovább.)

Na, ez lehet hogy egy kicsit homályos nekem. De a Decode csatornákon keletkező 1/2 mikroOP az csak 1 utasítást jelent, nem 1/2-őt. Vagy tévedek?

(#1294) #95904256 válasza dezz (#1292) üzenetére


#95904256
törölt tag

dezz, akkor most a segítségedet kérem. Ugyanis nem értettem meg hogy ''a dekódolás szélessége önmagában nem döntő tényező''. Először is, ezt miért mondod? Másodszor mit értesz ''döntő'' alatt? Harmadszor ha a döntő = jelentős, akkor miért nem az?

Egyébként ha azt veszem amit már írtam, hogy az IPC=1,5 értéket is nehéz elérni akkor ezzel csak megerősítettél abban hogy az IPCmax érték növelés nem hoz túl sokat a teljesítmény növelésében.

(#1295) dezz válasza #95904256 (#1293) üzenetére


dezz
nagyúr

''A 4/5 mikroOP bizony jelenthet 4/5 utasítást is a Core2 esetében, ugyanis az utasítások jelentős részénél 1 utasítás = 1 mikroOP megfeleltetés áll fenn, ha nincs memória hivatozású operandus.''
Hát, kíváncsi lennék P.H. véleményére, mekkora részük.

''Na, ez lehet hogy egy kicsit homályos nekem.''
Melyik része?
Intelnél: x86/stb. utasítások = makroOP, ezek közvetlenül mikroOP-okra fordulnak.
AMD-nél: a x86/stb. utastások először makroOP-okra fordulnak, melyek 1-2db mikroOP-ot tartalmaznak.
Az ábrán, és a cikkben ez utóbbi dolog figyelmen kívül lett hagyva.

''De a Decode csatornákon keletkező 1/2 mikroOP az csak 1 utasítást jelent, nem 1/2-őt. Vagy tévedek?
Nem tévedsz, de én nem is mondtam mást. 3,0 -> 3,0.

''dezz, akkor most a segítségedet kérem. Ugyanis nem értettem meg hogy ''a dekódolás szélessége önmagában nem döntő tényező''. Először is, ezt miért mondod? Másodszor mit értesz ''döntő'' alatt? Harmadszor ha a döntő = jelentős, akkor miért nem az?''
Mert a dekóderek utáni részeknek, és talán a retirementnek szűkebb a keresztmetszete.
(De a dekóderekkel is lehet valami, mert hiába tud mind fúziót, egy 5-ös mikroOP csoportból csak 2db-ot lehet párosítani eggyé.)

''Egyébként ha azt veszem amit már írtam, hogy az IPC=1,5 értéket is nehéz elérni akkor ezzel csak megerősítettél abban hogy az IPCmax érték növelés nem hoz túl sokat a teljesítmény növelésében.
Hát igen, nem az említett dolgokon múlik a hétköznapokban a teljesítmény.

[Szerkesztve]

(#1296) #95904256 válasza dezz (#1295) üzenetére


#95904256
törölt tag

akosf:Na, ez lehet hogy egy kicsit homályos nekem.
dezz:Melyik része?

Úgy tudtam hogy a K10 egy decode egység csak egy utasítást fordít 1-2 microOP-ra.
Te meg írtad hogy a decode egységek kimenete 1-2 microOP-ot generál.
Nem tudtam mire venni a dolgot. De ezek szerint csak redundáns információ.

akosf:De a Decode csatornákon keletkező 1/2 mikroOP az csak 1 utasítást jelent, nem 1/2-őt. Vagy tévedek?
dezz:Nem tévedsz, de én nem is mondtam mást. 3,0 -> 3,0.

Nem mondtam hogy mást mondtál.
A kérdést azért tettem fel hogy tisztázódjon a homályos folt.
Tisztázódott. Mindketten ugyanazt állítjuk.

(#1297) dezz válasza #95904256 (#1296) üzenetére


dezz
nagyúr

Azért nem teljesen ''redundáns'', mert ha úgy tekintjük, hogy ilyen mikroOP-okból mehet tovább egyszerre max. 3db, akkor tévedésbe esünk. Valójában ebből 3-6db mehet tovább.

[Szerkesztve]

(#1298) #95904256 válasza dezz (#1297) üzenetére


#95904256
törölt tag

Miben tévedünk?
A mikroOP-oknak szerintem nincs túl nagy jelentőségük. Inkább az az érdekes hogy mennyi utasítást tudok végrehajtatni a processzorral, hiszen a program is utasításokból áll, nem mikroOP-okból.

(#1299) dezz válasza #95904256 (#1298) üzenetére


dezz
nagyúr

Persze, hogy végső soron az IPC számít, de éppen ennek próbálunk utána járni (a teljesség igénye nélkül :D ).

A linkelt ábrán az látható, hogy AMD-nél a Pack Bufferből egyszerre 3 ''uop'' mehet tovább. És eléggé nem mindegy, hogy ez (AMD-féle) makroOP, vagy mikroOP, mivel 1 makroOP = 1 v. 2 mikroOP (DirectPath esetén, amikoris 1 utasítás = 1 makroOP). Tehát, max. IPC = 3 utasítás, akkor is, ha 2 mikroOP-os művelet (ugye memória-művelet), és akkor is, ha csak 1.

Ezzel szemben Intelnél az IPC 4 csak a 4 egyszerűbb, vagy 3 egyszrűbb (1 mikroOP-os) + 1 összetettebb (fúzióval 1 mikroOP-ossá tehető) utasításoknál lehet. Más esetekben 3, vagy épp csak 2. (Azon igen ritka esetekben lehet talán 5, ha az első 2 feltétel valamelyike teljesül, plusz egy makroOP fúzió is bejátszik, ha ezek egyszerre is működhetnek. Illetve azt nem tudom, különböző utasítások mikroOP-jai fúzionálhatók-e mikroOP fúzióval.)

Persze a legkorrektebb egy minden utasításra, plusz azok átlagos kódokbeli előfordulási arányára számolt IPC összehasonlítás lenne.

[Szerkesztve]

(#1300) dezz válasza dezz (#1299) üzenetére


dezz
nagyúr

Sőt van itt még valami. AMD-nél 1db VectorPath, vagy 3db DirectPath, akár összetett, 2 mikroOP-os utasítás mehet át. Intelnél viszont csak az egyszerű, 1 mikroOP-osokból mehet át több (*), az összettekből viszont csak 1...

* Elvileg ugyan minden Simple Decoder tudja a mikroOP fúziót, azonban ez nem tűnik igaznak, mivel tesztek szerint 4 egyszerre végrehajtott mikroOP-ból csak egy lehet fúzionált. (Akinek van kedve, letesztelhetné.)

Copyright © 2000-2024 PROHARDVER Informatikai Kft.