Hirdetés

2024. május 3., péntek

Gyorskeresés

Hozzászólások

(#2) LordX


LordX
veterán

.. meg az OpenCL 4.4 is bemutatkozott.

Egyébként a dynamic parallelism az nem (csak) teljesítménynövelő feature (valamennyit javíthat, de hiszem, hogy jelentős), hanem inkább programozás könnyítő. Az OK, hogy a CPU indította el eddig a kerneleket, de előre be lehet ütemezni őket, és ha az OpenCL driver okos (Az AMD-éről tudom, hogy bizonyos esetekben képes rá), akár már párhuzamosan el tudja indítani a második kernel azon blokkjait, amelyiknek az adatai már rendelkezésre állnak, de az első kernel más blokkjai még futnak. Ellenben ezt iszonyat macera értelmesen megcsinálni.

A poén az, hogy a két hardver, ami ezt tudja, abból az egyik egyelőre egy vicc, a másiknál meg a gyártó deklaráltan tesz az OpenCL-re magasról..

(#3) Kendek válasza LordX (#2) üzenetére


Kendek
MODERÁTOR

Vagyis az OpenGL 4.4-re gondoltál? Mert amit írtál annak semmi értelme.

<-ƘƘ->

(#4) LordX válasza Kendek (#3) üzenetére


LordX
veterán

Jah, OpenGL 4.4, elnézést.

(#5) Sir Ny


Sir Ny
senior tag

vá, az a kép a webCL-lel, az AMD javával, a PyopenCL-lel nem túl bíztató.
Inkább hányinger hogy valaki rá írta egy képre hogy GPU programming, és hogy javascript. Az még hányingerebb, hogy mind a kettőt belenyilazták egy közös dobozba. Köszönöm, nem kérem.

-

(#6) Pttypang


Pttypang
veterán

hmm, érdekes :)

Everybody lies.

(#7) Z10N


Z10N
veterán

Engem konkretan az erdekelne (nem tudom, nem olvastam at a dokmumentaciot), hogy ha nekem a rendszerbe vannak szamoloegysegek, azokat mikent lehet kombinalva munkara birni.

Pl.: van egy APU es GPU akkor azok, hogyan dolgoznak ossze. Ertem ezalatt ha van egy APU 4 core (384SPU) + GCN dGPU

VAGY egy regebbi pelda:
785G chipset (HD4200: 40 SPU + 128MB DDR3) + HD6870 (1120SPU + 1GB DDR5) + Phenom2 4 core

Tehat az integralt es a kiegeszito szamoloegysegeket osszekombinalni/szinkronizalni. A regebbi setup nem megy, de az ujabbal?

# sshnuke 10.2.2.2 -rootpw="Z10N0101"

(#8) subpixels


subpixels
tag

(#9) ar


ar
tag

A PC-s vilag elindul az Amiga es az SGI UMA tervezesi elvei iranyaba ha jol ertem? ... (kozos mem a proc es a video proc kozott + parhuzamos feldolgozas)

(#10) velizare válasza ar (#9) üzenetére


velizare
nagyúr

ha megnézed a hardverek fejlődéstörténetét, ciklikusan váltják egymást az univerzális, és a specifikus feldolgozók.

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.

(#11) LordX válasza Z10N (#7) üzenetére


LordX
veterán

Minden OpenCL-t támogató egység külön device. Alapvetően minden device-ra külön kell programot feltölteni, ha a program ezt támogatja, akkor lehet használni, egyébként nem. (Ha különböző a gyártó, pl. Intel integrált + diszkrét grafika is van a gépben, akkor bonyolultabb, mert ott valószínűleg különböző kód is kell.) Ezen az OpenCL 2.0 sem változtat.

Az a baj, hogy amit kérsz, az nagyon bonyolult feladat. Egy integrált GPU lassabb, de gyorsabban éri el a főmemóriát, ami relatíve lassú, de kis késleltetésű. vagy akár közös címteret is használ. A diszkrét jóval gyorsabb processzorral, gyors, de nagy késleltetésű memóriával rendelkezik, és iszonyatos késleltetése van a főmemóriához. Hogyan szeretnéd 'automatikusan' szétosztani a feladatokat? Lehet, mire át-/visszamásolod az adatot a gyorsabb diszkrét kártyára, a lassabb integrált már végezne. Meg egyébként is, a forráskód is különböző kell legyen, ha értelmes sebességet akarsz kihozni. Utolsó sorban az OpenCL messze nem egy platformfüggetlen nyelv: Ami az egyik GPU-n optimális, a másikon le se fordul, és ez egy gyártó termékein között is igaz.

(#12) ddekany válasza Sir Ny (#5) üzenetére


ddekany
veterán

"az a kép a webCL-lel, az AMD javával, a PyopenCL-lel nem túl bíztató.
Inkább hányinger hogy valaki rá írta egy képre hogy GPU programming, és hogy javascript."

:U Pontosan mi ezzel a baj?

(#13) Z10N válasza LordX (#11) üzenetére


Z10N
veterán

Amiket elmondtal a felpeitesekrol azokkal tisztaban vagyok (sebessegek, idozitesek, eleresek, fuggosegek, stb.). Az OpenCl 2.0 dokumentaciojat nem olvastam meg el. Ezert kerdeztem: "a platform megjelenése óta a legnagyobb újítások mutatkoztak be."

A konkret kerdesem akkor, ha pl.: egy jatekban van MI + fizika + grafika, az MI fut az IGP-n (APU), a fizika CPU-n (APU), a grafika GPU-n. Erre lettem volna kivancsi, hogy van-e mar ilyen impelementacio. Platformban csak AMD egyertelmuen, semelyik mas gyartonak nincs jelenleg ilyen mindenre kiterjedo megoldasa. Az AMD meg ezt hangsulyozza es erre fele fejleszt (az uj konzolok, amik most majd egy lepessel elorebb jarnak szinten). Szoval azt akarnam, hogy ha mar lesz egy APU + dGPU, ami a jovoben mar elkerulhetetlen, akkor jo lenne ha minden eroforrast ki tudnanak hasznalni a szoftverek, ne csak "malmozzanak" kozbe. A video/photo editalas, 3d rendereles, kodolas/tomorites, adatbanyaszat, stb. ezeket fel lehetne osztani csomagokra. A feledat utemzes persze kenyes kerdes, ahogy mondtad is, de nem lehetetlen, ha platformban gondolkodunk. Udv.

[ Szerkesztve ]

# sshnuke 10.2.2.2 -rootpw="Z10N0101"

(#14) LordX válasza Z10N (#13) üzenetére


LordX
veterán

Ha a játék/program támogatja, akkor van, egyébként nincs.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.