JanR (#14): kosz szepen!
tlac (#15):
jo, hogy kerdezted ezt a dolgot, mert egy kicsit elcsesztem a cikkben.. mentsegemre legyen szolva, hogy az Apple doksiban is el van rontva, illetve az OpenCL eszkoz infokat lekerdezve is rossz adatokat kapok..
a cikkben ezt irtam a Compute Unit-okrol:
Az OpenCL eszköz (device) az a hardver, amin a párhuzamos feldolgozás történik. Ezekben a hardverekben több, úgynevezett számolási egység (compute unit) van - tulajdonképpen ezek hajtják végre az utasításokat. Például egy videokártya minden stream processzora, és egy CPU minden magja is egy számolási egység.
nos, ez igy nem igaz, itt a Compute Unit-ot ki kell cserelni Processing Element-re.. a Compute Unit a Processing Element-ek egy csoportja (az nVidia multiprocessor-nak hivja, es egy multiprocesszor 8 darab procit tartalmaz).. nagyjabol az a helyzet, hogy egy work-group work-item-jeit futtatja egy compute unit.. az, hogy ez konkretan hogyan van megoldva, implementacio-fuggo, nVidia kartyakra a CUDA doksiban szepen le van irva, hogy is tortenik ez.. gondolom ATI-eknak is van valami dokumentaciojuk, nekem csak nVidiam van, igy csak azzal foglalkoztam..
tehat OCL-ben te be tudod allitani a work-group meretet, illetve a work-item-ek szamat; az, hogy ez konkretan hogyan kerul kiosztasra a CU-k/PE-k kozt, az OpenCL runtime dolga..
// cikk atirasa folyamatban...
[ Szerkesztve ]
in asm we trust