Hirdetés

2024. május 2., csütörtök

Gyorskeresés

Hozzászólások

(#1) lenox


lenox
veterán

Es lehet tudni, hogy milyen teszt van az OpenCL sebessegmeresben?

(#2) kcsa


kcsa
veterán

Nem vagyok hozzáértő. De ha a sebességmérés optimalizált, akkor az nem fals eredményt ad? :) :B

(#3) Fiery válasza lenox (#1) üzenetére


Fiery
veterán

A tesztek jo resze a nyers lebegopontos ill. integer feldolgozasi teljesitmenyt méri, de a mar jol ismert FPU Julia es FPU Mandel fraktal benchmarkok is implementalasra kerultek OpenCL alapon is. Hosszabb tavon tervezzuk, hogy adattömörítési, Hash, AES ill. ray-tracing benchmarkot is beepitunk; valamint mas platformokra is portoljuk az OpenCL benchmark panelt.

[ Szerkesztve ]

(#4) Dr. Romano válasza Fiery (#3) üzenetére


Dr. Romano
veterán

Ez tök jó, régi kártyákkal is megy az a teszt?

Ez....e...ee...ez egy.... ez egy FOTEL???

(#5) Fiery válasza kcsa (#2) üzenetére


Fiery
veterán

Az optimalizacio azt jelenti, hogy minden platform, minden processzor (es most mar minden GPU) eseteben kihasznaljuk azokat az architekturalis sajatossagokat, amikkel a benchmark eredmenyet emelni lehet. Pl. Intel Haswell processzornal hasznalunk AVX-et es FMA-t, AMD Kaveri eseteben pedig pl. XOP-t ill. FMA4-et. A GPU-k eseteben az optimalizacio automatikusan tortenik, azaz tobbfele modon is elvegzi a benchmark ugyanazt a szamitasi feladatot, es a legkedvezobb eredmenyt adja vissza. A GPGPU benchmark panelen a Results gombra kattintva lehet egyebkenet megnezni, hogy az egyes alfeladatok eredmenyei hogyan viszonyulnak egymashoz, pl. az adott GPU architekturan a kulonbozo vektorizacios es unroll technikak milyen elonyokkel vagy hatranyokkal jarnak.

(#6) Fiery válasza Dr. Romano (#4) üzenetére


Fiery
veterán

Barmivel, ami OpenCL-t tamogat es GPU eszkozkent tartja nyilvan az OpenCL driver. Sikeresen teszteltuk pl. nVIDIA G80-on, G84-en es G86-on is, amelyek az elso GPGPU architekturak voltak PC-n.

[ Szerkesztve ]

(#7) kcsa válasza Fiery (#5) üzenetére


kcsa
veterán

ok, világos :R

(#8) Dr. Romano válasza Fiery (#6) üzenetére


Dr. Romano
veterán

Na ez jól hangzik :)

Ez....e...ee...ez egy.... ez egy FOTEL???

(#9) lenox válasza Fiery (#3) üzenetére


lenox
veterán

A mem read/write gpu-nal busz transzfer, mig a copy a kartyan beluli copy?

(#10) Fiery válasza lenox (#9) üzenetére


Fiery
veterán

Igy van. Videokartyaknal (diszkret GPU-knal) Memory Read = Device-to-Host Bandwidth, Memory Write = Host-to-Device Bandwidth. Host = CPU, Device = dGPU ebben az esetben. Videokartyak eseteben ezen savszelessegeket a PCI Express kapcsolat ateresztokepessege determinalja, azaz tulajdonkeppen a PCIe savszelesseget lehet veluk mérni.

A Memory Copy minden GPU fajta eseteben a GPU sajat videomemoriajan beluli adatmozgatast mutatja, azaz messzirol hunyoritva a videomemoria savszelessegere emlekeztet. Csak azert nem egyezik meg azzal, mert nagyon nehez a kozelebe kerulni az elmeleti savszelessegnek, altalaban jelentosen kisebb sebesseget lehet csak elerni a gyakorlatban (benchmark segitsegevel).

[ Szerkesztve ]

(#12) Fiery válasza #32839680 (#11) üzenetére


Fiery
veterán

Elmeletileg lehetseges Windowst bootolni es AIDA64-et futtatni a Quarkon (mint x86 CPU architekturan), csupan a "körítésen" mulik minden, azaz hogy milyen alaplapot epitenek a Quarkra, es milyen BIOS-t implementalnak. Ugyanigy, ha pl. valaki felpakol egy Win8.1-et az Xbox One-ra, azon is fog futni az AIDA64, pedig nem PC-s processzor van benne elvileg, csak rokona a PC-s processzoroknak :))

[ Szerkesztve ]

(#14) lenox válasza Fiery (#10) üzenetére


lenox
veterán

Koszi az infot. Emlekeim szerint 10%-ra meg tudtam kozeliteni az elmeleti savszelesseget. Amugy raytracre ajanlom ezt :) . Mondjuk az exe mar nem letoltheto, de nekem nyilvan megvan.

(#15) Fiery válasza lenox (#14) üzenetére


Fiery
veterán

Koszi, de nem szeretnenk kulso forrasbol epitkezni a ray-tracing teszt kapcsan, hanem teljesen in-house megoldasra torekszunk. Jogi szempontbol is ez a legjobb variacio, es igy lehet a legkonnyebben kezben tartani a fejlesztest is.

A 10% egyebkent egesz jo, high-end videokartyaknal altalaban joval nagyobb szokott lenni az elmeleti es a gyakorlati savszelesseg kozotti kulonbseg.

(#16) Fiery válasza #32839680 (#13) üzenetére


Fiery
veterán

WinXP siman elmenne egy 400 MHz-es Quarkon, nem lenne az olyan lassu. Mas kerdes persze, hogy velhetoen az ISA nem felelne meg a WinXP telepitesi kovetelmenyeinek; de a Win2000 megfelelne, azt mi hasznaljuk K5-on is peldaul, ami a Quarknal lenyegesen gyengebb teljesitmenyu CPU.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.