2024. május 2., csütörtök

Gyorskeresés

Útvonal

Cikkek » Számtech rovat

FX-4100: a legkisebb Bulldozer

Gyors teszten a legkisebb Bulldozer: tuning, szorzólock, TDP fal, alulfesz, turbo core, játék, minden!

[ ÚJ TESZT ]

Linux kernel

Mára végre lefutott az összes Linux alatti teszt. A "gyári" 2.6.38-as kernelt fordítottam le pár tucatszor 1-6 threaden. Az X6-ot nem tuningoltam. Az X3-mat mértem alap (3GHz) és OC beállítás (3.75GHz) mellett. Az FX-4100 alap 3.6GHz-es, és két 4.2GHz-es beállítás mellett is megmérettetett. A BE a sima szorzó emelést, a HT a referencia órajeles beállítást takarja.

Ha az alapórajelen mutatott teljesítményt nézzük, akkor az X6 magabiztosan nyer. Ez nem csoda, 6 maggal ezt vártam. Ha csak egy szálat használunk fordításra, akkor viszont a Bulldozer a leggyorsabb. Tuningolva sem változik a helyzet, simán legyőzi a régi magokat. Feltételezem ebben benne van a nagy méretű L3 cache. Tuningolva változik a két kis CPU aránya. Az X3 a tuning hatására megtáltosodik és 3 szálon gyorsabb, mint az FX 4 szál esetén. Ez azért érdekes, mert a Bulldozer 2 szálon még vezet.

Érdemes normalizálni az adatokat és grafikonon ábrázolni. Magyarán az adott beállítás több szálas eredményeit a 1 szálon elért eredményéhez viszonyítom, így láthatóvá válik, hogy a különálló feldolgozó szálak növelése mennyit hoz a konyhára. Az ideális az, ha teljesen lineárisan skálázódik a CPU, azaz ahány szál, annyiszor gyorsabb a kernel fordítása. Persze ezt limitálja a merevlemez, a memória sávszélesség, L3 cache, oprendszer ütemező és még tucatnyi más dolog. Láthatóan három csoportra oszthatóak a processzorok és beállítások:

Az alap órajeles X3 és X6 szépen, szinte lineárisan skálázódik. Az Athlon majdnem 3x akkora teljesítményre képes több szálon, mint 1 szálon, míg a Phenom 6 szál esetén 5x gyorsabb, igaz ebben benne van, hogy a turbó aktív volt.

A tuningolt X3 érdekes módon jobban gyorsult, mint az várható. Nem tudom mi a magyarázat, de az ellenőrző mérés most futott le hasonló eredménnyel. Már 1 vs. 2 szál között is 2-nél nagyobb a gyorsulás.

A leginkább érdekes csoportot az FX adja. Láthatóan, hogy a skálázódás nem lineáris. Két szálig még skálázódik, ami ugye 2 modulnál nem csoda. A 2 szál esetén nem arányos teljesítményt kis részben lehet magyarázni a turbo core-ral, ami miatt nem éri el a 2-őt a viszonylagos teljesítmény. 3 és négy szál esetén viszont sokkal nagyobb a visszaesés, mint amit a turbó (3.8GHz) és alap (3.6GHz) órajel közötti különbség megmagyarázna. Gyári beállításnál ráadásul még TDP fal sincs. Ez bizony a Bulldozer modulos felépítésének limitáló hatása. Az eredmény alapján 1 modul durván 1.5 magnak felel meg, ha teljesen kihajtjuk. Ha nincs teljesen leterhelve, akkor viszont többre is képes lehet, mert a megosztott részek nem fogják vissza az IPC-FP részeket.

Jó kérdés, hogy a Bulldozer rossz skálázódása mennyire vezethető vissza hardveres és mennyire szoftveres okokra. A következő grafikonon azt láthatjátok, hogy a linux kernelt mennyi idő alatt sikerül lefordítani 2 szálon (make -j 2). Négy beállítás próbáltam ki. A leglassabbnak az bizonyul, amikor csak egy modult engedélyezek, azaz a két thread ugyanazon FX modul két magját használja. Sokat gyorsul a fordítás, ahogy két modulból egy-egy magot használok. Ha az ütemezést a Natty (Ubutu 11.04) 2.6.38-as kernelére bízom, akkor kicsit még tovább gyorsul. Ennél sokkal nagyobb előrelépés, ha a rendszer alatt egy optimalizált 3.2-es kernel van. Az új kernellel durván 3/4 annyi időre van szükség a munka elvégzéséhez, ami hihetetlenül nagy előrelépés, még az első két beállítás közöttinél is nagyobb.

Gondolom kíváncsiak vagytok arra, hogy az új kernellel hogyan skálázódik az FX. Ha az optimalizáció tényleg jó, akkor 3 fölé kell, hogy kerüljön a 4 szálas viszonyított teljesítmény. Ez nem sikerül, de kb. 10%-kal jobb lett. Ez az előző optimalizálással együtt 33% feletti a javulás, ugyanis 24:11 helyett 17:48 alatt végez a fordítással.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

  • Clarkdale - Core i3-530 teszt

    A 1156 egy átmeneti platform volt, ezért kicsit számkivetett, de kíváncsi voltam mit is tudhat.

  • Serious Sam 3: BFE

    Klasszikus játék mai köntösben. Hordákban támad az ellen. Az eredmény romok és testrészek mindenütt.

  • i7-2600 Hyper-threading

    A kérdés: mire jó hyper-threading 2 és 4 mag esetén?

  • Raspberry Pi bemutató

    Pár gondolat, teszt, felhasználási tipp és egy kis overclock a Raspberry Pi "miniszámítógépről".

Előzmények

Hirdetés

Copyright © 2000-2024 PROHARDVER Informatikai Kft.