2024. március 29., péntek

Gyorskeresés

Nvidia Tesla P4 játékra avagy az GTX1080 8Gb ultra mini

Írta: |

[ ÚJ BEJEGYZÉS ]

Ismét egy érdekes kártya került hozzám, Tesla szériával már foglalkoztam és vegyes tapasztalatim vannak. Ezeket a kártyának nehezebb beállítani játékra mint az AMD megfelelőiket. Ennek oka hogy nvidia nagyon keményen tiltja ennek a használatát mind driveresen mind szoftveresen. Részben érthető hiszen nem akar konkurenciát saját magának a kiselejtezett, raktárból maradt kártyák játékosok felé elárasztásával. Gondoljunk bele egy szerverfarmon több ezer ha nem tízezerszám vannak ilyen kártyák és bizony mennek a szemétbe (jobb esetben hatékonyan újrahasznosítva, rosszabb esetben egy afrikai nyomortelep mellett brooklyn kályhában végezve).

Gondolom mindenki egy ITX méretű 1080-at várt, erre itt egy low profile egyslotos kártya. :DDD

A kártya alacsony profilú és eredeti környezetében "kereszthuzatos" hűtésű azaz kell neki aktív hűtés, később le is írom hogyan.

Érdekes hogy maga a kártya egy asztali viszonylatban nagyobb kategóriájú GPU-ra épül, pontosabban teljes értékű vágatlan GP104-re ami kissé megvágva GTX1070-1070ti és teljes formájában 1080 kártyákon volt. Tehát elég furcsa ilyen méretben viszont látni, ráadásul egy slotosként.

Extra tápcsatlakozót nem találunk rajta, így be kell érni a PCIE csatlakozón keresztüli maxiumum 75w TDP-vel ami megint érdekes egy ilyen GPU-hoz. Ráadásnak a vram sem a nagy asztali kártyákon található GDDR5X hanem a visszafogottabb kevesebb sávszélességű de eleve kevesebbet is fogyasztó GDDR5.
Foglaljuk tehát össze, adott egy teljes értékű GP104 GPU amely limitálva van 75w-ra teljes kártyát nézve, egyslotos alacsony profilú hűtésre és jóval kevesebb ramsávszélre. Ilyen méretben GTX1050-et képzelnénk el. Techpowerup Tesla P4 specifikációk.

A kártyát alapból nem tudjuk játékra bírni, fent említettem hogy nvidia megkavarta kicsit. Szerencsémre van konkrét alapos leírás ennek megoldására.
Nvidia Tesla P4 and AMD RX 6400 – low profile graphics cards


A kártyának elég kevés követelménye van, above 4g decoding sem szükséges hozzá nem úgy mint a többi nagyobb Tesla kártyának. Viszont egy adott driver szükséges hozzá. Nyilván mivel nincs kimenete ezért kell mellé egy másik kártya is. Intel integrált megoldást nem igazán ajánlanám hozzá, tapasztalataim szerint azok enyhe lagot okoznak. (régebbi gépen nem is csak enyhét) Fontos hogy Nvidia tiltja több verziójú driver futtatását egy OS-en belül és bizony a Tesla drivere nem egyezik a GTX/RTX asztali driverekkel így ezen kártya mellé ezek nem használhatók de működik akár milyen AMD/Quadro kártyával.
Driverből 511.65-re lesz szükségünk.
Valamint rendszergazdai parancssorba beírni a maximum boost órajelét a kellő teljesítményhez:
nvidia-smi -ac 3003,1531

Teljesítményben fontos hogy ne egy nagy dög asztali GTX1080 kártyához viszonyítsuk mert bár GPU ugyan az de elég ha ránézünk a kártyára inkább egy hasonló méretű kártyával mérjük össze pl GTX1060/1650 vagy RX6400 (ezekből biztosan van low profile). Persze nyilván nem játékra készült de az nem akadályoz meg abban hogy kipróbáljuk arra is. Ugye mivel itt nincsen tápcsati és low profile ezért belerakható laposabb irodai gépekbe is, persze extra hűtést meg kell rá oldani.
Hűtésre két megoldás van, vagy leszedjük a kártya borítását és direktbe rakunk rá ventilátort vagy hátulról nagyobb nyomású ventilátorral fújatjuk át a kártyát. Igazából itt csak 75w-ról van szó így mindkét megoldást jó lehet.

Szétszedés, újrapasztázás:

A gyári paszta már betonkemény, a padok kissé kifolytak, meglehetősen puhák és törékenyek.


Samsung K4G80325FB-HC25
Ezek a ramok a 1070-es kártyákra kerültek (pl ASUS ROG Strix GeForce GTX 1070), érdemes megemlíteni hogy bizony itt jóval alacsonyabb órajelen járnak, feltételezhető hogy van bennük bőven tartalék.
Azaz a jelenlegi 1500-as órajel helyett, 2000 vagy ez feletti amire képesek lennének de persze nem tudhatjuk hogy most milyen időzítésekre és feszültségekre vannak belőve így semmi nem garantált.

Akkor pár teszt:
3Dmark Timespy, Superposition, Aida64



Vicces kissé hogy alig tesztelték a kártyát, és van még benne tartalék.

Hozzászólások

(#1) Cucuska2


Cucuska2
őstag

Nagyon kíváncsi vagyok, hogy videó enkódolásban mennyire hatékony egy ilyen kártya.

Rock and stone, to the bone! Leave no dwarf behind!

(#2) Luck Dragon válasza Cucuska2 (#1) üzenetére

Nem nagyon , bár alkalmas lenne rá .

A káosszal teremtek rendet. Philips & TPvision primary visitor. Philips Design line.

(#3) MasterDeeJay válasza Cucuska2 (#1) üzenetére

Érdekes kérdés, mert bár rakás feldolgozója van de azok alacsony órajelen mennek TDP limitesen.
Ilyenre inkább valami Intel Arc kártyát vennék hardveres AV1-el.

(#4) nyunyu


nyunyu
félisten

Nézegetem, mit lenne érdemes a Tesla M40 helyett venni, de ötletem sincs.
P4 gyengébbnek tűnik a 75W TDP és alacsony órajelek miatt, P40 valamivel erősebb, P100 meg eléggé sötét ló a HBM2 miatt.
V100-ak meg még drágák.

Hello IT! Have you tried turning it off and on again?

(#5) Cucuska2 válasza MasterDeeJay (#3) üzenetére


Cucuska2
őstag

A szervertérben egyértelműen azt a paradigmát követik, hogy high-end chipek sok memóriával alacsony órajelen, számomra meglepő volt például, hogy az A100-ok CUDA-ban nem gyorsabbak a top 30-as kártyáknál, cserébe jóval energiahatékonyabbak az alacsonyabb órajelek miatt.

Ezért gondoltam erre a kártyára. Linux és támogatás hiánya miatt nem akarok Intel Arcot venni még egy hosszabb ideig az otthoni szerverembe, ez viszont egy nagyon érdekes kártya.

Rock and stone, to the bone! Leave no dwarf behind!

(#6) MasterDeeJay válasza nyunyu (#4) üzenetére

P4 nem az M40 ellenfele. (M40 egy jó biossal az kb GTX1070Ti szint ez meg 1070 sima alatt van)
P4 az budget kártya (kb 30eft) fullhd-re játékra éppen használható megkötésekkel.
P40 meg egy fullos TitanXP az igazi erőgép.
P100 az már nagyon speckó.
Ha lesz driver a Radeon Pro V540-esre akkor két RX5700XT HBM2-vel versenyképes lehet bár 83eft-ra jött ki postával vámmal. Bár AI-ra nálam inkább nvidia a nyerő.

Cucuska2
Mondjuk tovább is bírják mint az asztaliak bár eleve jobb minőségben is készülnek. Mivel próbáljam ki? Ha gondolod letesztelem de most csak win11-el tudom. Tesztgép sincs teljesen kész de már működik Z440 workstation azaz procit még csak egy 2630v3-as, ram már megvan 4x16gb ecc reg de úton van a 2696v3-as hozzá amivel remélem száguldani fog.

[ Szerkesztve ]

(#7) szbela87 válasza MasterDeeJay (#6) üzenetére


szbela87
újonc

Kiváló ötletet adtál. :R
Két P4 elméletileg már 11.4 Tflop számítási teljesítményt tud, az a gyakorlatban inkább 10.5 lesz, és 11.7 Tflop a P40 teljesítménye (m40-é meg 6.8 Tflop). A fogyasztása együtt a két P4-nek is csak 150W. Mindez csak akkor értelmes összemérés a részemről, ha olyan dolgot használunk, ami gpu-ra parallelizálható.

A hűtésre nagyon kíváncsi lennék. Az nagyon meglepett, hogy nem kell neki az "above 4g decoding".

"Az információ a társadalom gittje." N. W.

(#8) MasterDeeJay


ECC-t kikapcsoltam.
Boost növelve. Érdekes de alig kell hűteni, két házventi fúj át rajta. Proci még nem érkezett meg, addig nem tesztelek mivel 2630v3 az gyenge hozzá (8 mag 3.2ghz max)

szbela87
7 Tflops egy kártyának a float32-je
de float64 meg igen gyenge 0.2 Tflops
Viszonyításnak egy ős Tesla C2075 (GTX580 6Gb):

[ Szerkesztve ]

(#9) szbela87 válasza MasterDeeJay (#8) üzenetére


szbela87
újonc

,,két házventi fúj át rajta'' Ezt hogy érted?
Levetted a burkolatot és oldalról?

Ebayen találtam hozzá egy jópofa megoldást, de megvárnám a további tapasztalataidat.

A k80, m40, p40 double-je is gyenge (a techpowerup szerint legalábbis).

"Az információ a társadalom gittje." N. W.

(#10) nyunyu válasza szbela87 (#9) üzenetére


nyunyu
félisten

200W-ra korlátozott M40 hűtése nem volt triviális, kellett hozzá a harmadik 2000rpm-es venti is, hogy ne érje el a 87C-t, amikortól throttlingol.

Pascal szériák BIOSát már nem lehet szerkeszteni, így nem nagyon tudsz a feszültségekkel, TDPvel játszani.

[ Szerkesztve ]

Hello IT! Have you tried turning it off and on again?

További hozzászólások megtekintése...
Copyright © 2000-2024 PROHARDVER Informatikai Kft.