[Re:] Ez lenne az AMD gigantikus APU-ja? - LOGOUT.hu Hozzászólások

LOGOUT.hu

Gyorskeresés

Főmenü

Legfrissebb anyagok

Teszt Olcsó USB WiFi AC adapter
Retro Gyere el a 9. BRSZK-ra!
Bemutató Bakancslista Route 66 Chicagótól Los Angelesig 3.
Elemzés USB to S/PDif konverter a modern RIAA, elektroncsövekkel
Retro Retro Kocka Kuckó 2024

Általános témák

LOGOUT.hu témák

Szakmai témák

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

Útvonal

Fórumok » Processzorok, tuning » [Re:] Ez lenne az AMD gigantikus APU-ja?

Navigáció

ugrás

üzenetek

138 - 138

fórumok

További fórumlisták

listázás

50 db / növekvő

Hozzászólások

(#138) P.H. válasza LordX (#136) üzenetére

Új
Válasz
Privát
2015-08-11 22:11:09

P.H.
senior tag

Egyszerűbb lenne, ha egyszerűen beidéznéd a vonatkozó részeket, mert én nem azt látom benne, amit leírtál, hanem ezt:

8.1.2 Bus Locking

"Intel 64 and IA-32 processors provide a LOCK# signal that is asserted automatically during certain critical memory operations to lock the system bus or equivalent link. While this output signal is asserted, requests from other processors or bus agents for control of the bus are blocked. Software can specify other occasions when the LOCK semantics are to be followed by prepending the LOCK prefix to an instruction."

8.1.2.2 Software Controlled Bus Locking

"To explicitly force the LOCK semantics, software can use the LOCK prefix with the following instructions when they are used to modify a memory location. An invalid-opcode exception (#UD) is generated when the LOCK prefix is used with any other instruction or when no write operation is made to memory (that is, when the destination operand is in a register)."

"• The bit test and modify instructions (BTS, BTR, and BTC)."
(bit test&set utasítások)

"• The exchange instructions (XADD, CMPXCHG, and CMPXCHG8B)."
(compare&exchange utasítások)

"• The LOCK prefix is automatically assumed for XCHG instruction."
(exchange reg<->mem)

"• The following single-operand arithmetic and logical instructions: INC, DEC, NOT, and NEG."
(logikai utasítások)

"• The following two-operand arithmetic and logical instructions: ADD, ADC, SUB, SBB, AND, OR, and XOR."
(logikai és +/- utasítások)

Mely eset maradt ki, amikor életbe lép a 8.1.2 fejezet?

"A locked instruction is guaranteed to lock only the area of memory defined by the destination operand, but may be interpreted by the system as a lock for a larger memory area."
"Software should access semaphores (shared memory used for signalling between multiple processors) using identical addresses and operand lengths. For example, if one processor accesses a semaphore using a word access, other processors should not access the semaphore using a byte access."

Alapszabály, hogy aligned cache line-ra nem teszünk egyszerre szinkronizációs változót és adatot. Ezt már ~20 éve tudják a fordítóprogramok. (Persze nyilván meg lehet kerülni; milyen keyword-del tudatod tetszőleges nyelvben, hogy az adott változó módosítása elé tegyen LOCK-ot?
És milyen eljáráshívással? SetEvent, ResetEvent, WaitForSingleObject, ...)

A idézetből következik, hogy a fenti utasítások nem zárolják a teljes buszt, hanem csak adott memóriaterületet (ami nagyobb lehet, mint a ténylegesen módosított, praktikusan egy 64 byte-os teljes cache line, hiszen az Intel, az AMD vagy a VIA sem a maga ellensége). Ettől még a többi mag korlátozás nélkül végezheti az utasításvégrehajtást.
Ha másért nem is egyértelmű ez, az SSE3-ban (Prescott) bevezetett MONITOR és MWAIT utasítások létezése indokolja ilyen belső hardver létezését.

De megnézhetjük, mennyi is egy-egy locked utasítás végrehajtási ideje: naprakész hardvereken ebből a táblázatból is kinézhető http://agner.org/optimize/instruction_tables.pdf, vagy akár AIDA64-ben az Instruction Latency Dump is megadja LOCK ADD és XCHG mem,reg utasítások futási idejét, amelyen lefuttatjuk.

K10: XCHG 21 órajel Nehalem: XCHG 20 órajel Sandy B. XCHG 25 órajel Ivy B. XCHG 25 órajel LOCK ADD: 22 órajel Haswell: XCHG 21 órajel LOCK ADD: 19 órajel Bulldozer: XCHG ~50 órajel LOCK ADD: ~55 órajel Piledriver: XCHG ~40 órajel LOCK ADD: ~40 órajel Steamroller: XCHG ~38 órajel LOCK ADD: ~39 órajel
(Nem csak a PCLMULQDQ-ról lehet olvasni általánosan a sajtóanyagokban, hanem a locked műveletek gyorsabb és gyorsabb végrehajtásáról is.)

Gyakorlatilag magszinten a LOCK-prefixes művelet végrehajtása annyit jelent manapság, hogy amikor találkozik ilyennel a dekóder, akkor addig újabb utasítást nem dekódol, amíg ez végig nem ért a végrehajtási futószalagon és ki nem írta az eredményét egy rendszerszinten látható (=snoopable cache) memóriába (ez általában az L1D, a Bulldozer-család esetében az L2, ezért a nagy időigény).
A többi mag nyugodtan hajthat végre utasításokat, azokat nem befolyásolja (egy utasítást egy mag hajt végre), mert ha ott is van ugyanerrea memóriaterületre vonatkozó locked módosítás, akkor legfejlebb az nyer...; és nem mondom tovább, tudod.
Persze ebből össze lehet hozni az adott magon több száz órajeles időidényt, ha a forrásadatot RAM-ból kell beolvasni, de erre - azaz több mag által frekventáltan módosított adatterületek tárolására - vannak kitalálva alapvetően a nagyméretű L3 cache-ek. A TSX teljesen másra való.

[ Szerkesztve ]

Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

Navigáció

ugrás

üzenetek

138 - 138

fórumok

További fórumlisták

listázás

50 db / növekvő

Útvonal

Fórumok » Processzorok, tuning » [Re:] Ez lenne az AMD gigantikus APU-ja?

belépés

regisztráció

listázási beállítások

Hirdetés

Lapcsaládunk:

Gyorskeresés

Főmenü

Legfrissebb anyagok

Általános témák

LOGOUT.hu témák

Szakmai témák

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

Útvonal

Navigáció

ugrás

üzenetek

fórumok

listázás

Hozzászólások

Navigáció

ugrás

üzenetek

fórumok

listázás

Útvonal

További opciók

Hirdetés

Mai Hardverapró hirdetések

prémium kategóriában

ingyenes kategóriában

Portáljaink

Céginfó

Ajánlatok

mobil nézet

Támogatóink

H﻿ir﻿d﻿eté﻿s

Lapcsaládunk:

Gyorskeresés

Főmenü

Legfrissebb anyagok

Általános témák

LOGOUT.hu témák

Szakmai témák

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

Útvonal

Navigáció

ugrás

üzenetek

fórumok

listázás

Hozzászólások

Navigáció

ugrás

üzenetek

fórumok

listázás

Útvonal

További opciók

H﻿i﻿r﻿deté﻿s

Mai Hardverapró hirdetések

prémium kategóriában

ingyenes kategóriában

Portáljaink

Céginfó

Ajánlatok

mobil nézet

Támogatóink

Hirdetés

Hirdetés