Hirdetés
- Luck Dragon: Asszociációs játék. :)
- ubyegon2: Airfryer XL XXL forrólevegős sütő gyakorlati tanácsok, ötletek, receptek
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- sziku69: Szólánc.
- sziku69: Fűzzük össze a szavakat :)
- Real Racing 3 - Freemium csoda
- gban: Ingyen kellene, de tegnapra
- Jhonny06: Új gépsárkány
- GoodSpeed: Harcban az adathalászokkal - az AI tud segíteni?
- urandom0: Száműztem az AI-t az életemből
Új hozzászólás Aktív témák
-
laci1128
tag
Pont a héten volt szerencsém hallgatni egy HT-t is érintő önlab beszámolót, többszálú algoritmusokról. Naivan optimistán állt az előadó kezdetben a HT-hez (jött is az Inteles borsúra a szépen beigazított utasításokról, sok %-os teljesítménynövekedésről
)... De sajnos ahol használva volt a fizikai egység (példában az ALU volt, int-es szálak közti jelzés miatt a futás alatt végig terhelve volt) két ugyanahhoz a maghoz tartozó szál között, ott a HT negatívan módosította a teljesítményt (i7 2600K-n 4 szálig meredek emelkedés, 4-8 szálig gyenge visszaesés az algoritmus teljesítményében). ALU-t kevésbé terhelő megoldás esetén (szálak közti jelzésre int helyett signalok használatával) pedig hibahatáron belül (<5%) volt 4-8 szálig a javulás. Úgyhogy számomra az jött le a beszámoló után, hogy magasabb szintű programozási nyelven (a példában .NET/C#-ot használtak) összedobott párhuzamos algoritmusoknál fizikai magoknál több szálak alkalmazásával a brosúrában emlegetett számok nem hozhatóak sajnos, azaz gyakorlatilag a HT nem igazán számít (nem javít, nem is ront látványosan). Talán alacsonyabb szinten okoskodva (asm), talán Intel fordítóval optimalizált kódnál javulhat a dolog. Ill. esetleg még multitasknál üthet ki inkább az előny, ahol nem biztos, hogy az éppen futó több, akár eltérő alkalmazás szétterheli a proci összes fizikai részegységét egyszerre és akár működhet is a dolog. Erről viszont nem esett szó a bemutató során sem a mostani írásban.
Egyébként jó cikk, főleg a témája tetszik, van misztifikáció a HT-vel kapcsolatban rendesen.
Várom esetleg a folytatást más programokkal, tesztekkel.
Új hozzászólás Aktív témák
- ASUS blog: jó árú notebookok karácsonyra
- Januártól igényelhető a kiskorúak tartalomvédelme a mobilszolgáltatóknál
- Íme az év legszebb játékai - a Digital Foundry szerint
- Rezsicsökkentés, spórolás (fűtés, szigetelés, stb.)
- Témázgatunk, témázgatunk!? ... avagy mutasd az Android homescreened!
- exHWSW - Értünk mindenhez IS
- Videó stream letöltése
- Xiaomi 13T és 13T Pro - nincs tétlenkedés
- EA Sports WRC '23
- Torrent meghívó kunyeráló
- További aktív témák...
- ÁRGARANCIA! Épített KomPhone Ryzen 5 5600X 16/32/64GB RAM RTX 5050 8GB GAMER PC termékbeszámítással
- BESZÁMÍTÁS! Asus ROG G531GV Gamer notebook - i7 9750H 16GB DDR4 512GB SSD RTX 2060 6GB WIN11
- Telefon felvásárlás!! Samsung Galaxy A14/Samsung Galaxy A34/Samsung Galaxy A54
- Huawei Quidway S5324TP-SI-AC - 24G, 4SFP, L2, managed switch
- ÁRGARANCIA!Épített KomPhone Ryzen 5 4500 16/32/64GB RAM RTX 5050 8GB GAMER PC termékbeszámítással
Állásajánlatok
Cég: BroadBit Hungary Kft.
Város: Budakeszi
Cég: ATW Internet Kft.
Város: Budapest
)... De sajnos ahol használva volt a fizikai egység (példában az ALU volt, int-es szálak közti jelzés miatt a futás alatt végig terhelve volt) két ugyanahhoz a maghoz tartozó szál között, ott a HT negatívan módosította a teljesítményt (i7 2600K-n 4 szálig meredek emelkedés, 4-8 szálig gyenge visszaesés az algoritmus teljesítményében). ALU-t kevésbé terhelő megoldás esetén (szálak közti jelzésre int helyett signalok használatával) pedig hibahatáron belül (<5%) volt 4-8 szálig a javulás. Úgyhogy számomra az jött le a beszámoló után, hogy magasabb szintű programozási nyelven (a példában .NET/C#-ot használtak) összedobott párhuzamos algoritmusoknál fizikai magoknál több szálak alkalmazásával a brosúrában emlegetett számok nem hozhatóak sajnos, azaz gyakorlatilag a HT nem igazán számít (nem javít, nem is ront látványosan). Talán alacsonyabb szinten okoskodva (asm), talán Intel fordítóval optimalizált kódnál javulhat a dolog. Ill. esetleg még multitasknál üthet ki inkább az előny, ahol nem biztos, hogy az éppen futó több, akár eltérő alkalmazás szétterheli a proci összes fizikai részegységét egyszerre és akár működhet is a dolog. Erről viszont nem esett szó a bemutató során sem a mostani írásban.


