Hirdetés

2024. április 16., kedd

Gyorskeresés

Hozzászólások

(#1) flexxx2


flexxx2
őstag

Ez milyen területeken gyorsíthat? Gondolom egy normál adatkitöltős, grafikonos, táblázatos (max 100 soros) website esetén nem sokat.

(#2) Abu85 válasza flexxx2 (#1) üzenetére


Abu85
HÁZIGAZDA

Azt tudom elmondani, hogy a demók között volt a kihagyhatatlan nbody, és volt program szavak keresésére egy brutális adatbázisban, ami egy rakás könyv digitális másolatát tartalmazta. Utóbbiban olyan 4-5x-ös gyorsulás volt.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#3) ViZion


ViZion
félisten

Fedora? Nem a Red Hat?
Köszi a cikket, nekem mint usernek annyi jött le, hogy gyorsul. Mondjuk eddig veszett gyors volt :)

Hold on, trying to give a fuck... Nope, not Happening • Powered by Fedora Linux • "Az élet olyan sz@r, szerencsére a felén már túl vagyok" Al Bundy

(#4) $p@rr0w


$p@rr0w
őstag

A Minecraft is java nem? Az is gyorsulhat?

"Minecraft was created in Java, so it must also be installed to run the game."

[ Szerkesztve ]

Kinőhetnétek már abból, hogy leírogatjátok miből nőttetek ki.

(#5) bunevo


bunevo
tag

Végre, végre! :C
Remélem ettől majd lassan beindul az asztali és mobilos linux-kerneles környezetek hatékonyítása is. Nagyon kellett már ez a HSA! És java-kóddal is közelebb lehetünk az ideálishoz, nem muszáj GPGPU-nindzsának lenni.

(#6) Abu85 válasza $p@rr0w (#4) üzenetére


Abu85
HÁZIGAZDA

Csak ha átírják az öreg kódot, amit nem hiszem, hogy megtennének.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#7) Jack@l


Jack@l
veterán

Mielőtt nagy ujjongsba kezdene mindenki, nem a java kóüdok futnak majd jobban, hanem a lambda api-t használó kódik. (arc/képfelismerést csinálnak)
Szóval a nagy ujjongás az eddig is elég döcögősen megírt gpgpu-val gyorsított dolgokat érintik. Talán most egy fokkal könnyebb lesz rájuk programozni. (de biztos nem fog gyorsabban futni a progi, mint opencl-el vagy cudaval)

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#8) dabadab válasza $p@rr0w (#4) üzenetére


dabadab
titán

Nem nagyon, a Minecraft alapvetoen azert lassu, mert mert nagyon reszletes* a grafikaja es egyszeruen a GPU-t ennyire leterheli.

*: igen, az. Az osszes tobbi jatek azt csinalja, hogy a kozeli objektumokat (amikbol keves van) reszletesen rajzolja ki, a tavolaiakat (amikbol meg sok) meg elnagyolva ill. jo reszuket ki se rakja. A Minecraft meg a tavolabb levo dolgokat is mind ugyanugy kirajzolja, mint amikor kozel vannak, es hiaba csak egyszeru kockak, ha sokmillio van beloluk.

DRM is theft

(#9) Jack@l válasza dabadab (#8) üzenetére


Jack@l
veterán

Szerintem meg sikeres ember nem lehet, aki javaban ír játékot... :) (nem a "részletességgel" van ott a baj)

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#10) dabadab válasza Jack@l (#9) üzenetére


dabadab
titán

A C topikban elojott, hogy sima number crunchingnel a Java veri a C-t, szoval maga a Java nem lassu - mondjuk ott nem volt GC, de az meg nem folyamatosan lassit, hanem periodikusan, szoval nem amiatt lassu a MC.

"nem a "részletességgel" van ott a baj"

Erre vonatkozolag van barmi szamitasod/meresed/akarmid?

DRM is theft

(#11) Zso2


Zso2
őstag

Miért kell beígérni ilyen 10x szorzókat,ami megmarad a sok várakozó user fejében . Amikor meg launch van mindenki a csalódástól szitkozódik, hogy alig gyorsabb, közben meg többet fogyaszt.
Mennyi ilyet átéltünk már, a na majd a következő mekkorát fog durranni, mint az asztali megoldásoknál, ott is mindig nagyobb erőt sejtettek,mint ami lett a Kaveri -ből is.

[ Szerkesztve ]

Adelante ALONSO - Forza Ferrari | BF3-- satazso | Intel Core + Windows = Jaguar, behúzott kézifékkel.

(#12) Diocles válasza dabadab (#10) üzenetére


Diocles
aktív tag

"sima number crunchingnel a Java veri a C-t"

Gondolom a veri szót sikerült kreatívan definiálni, egyébként napi vicc rovatunkat hallották. Heh, heh.

(#13) Jack@l válasza dabadab (#10) üzenetére


Jack@l
veterán

Egyszerű kockákról beszélünk, kis p*csa textúrákkal. Meg kell nézni mennyire hajtja meg a gpu-t a játék, ha 80% alatt, akkor egy rosszul működő motorról beszélünk. (valahogy ki is lehet opengl alatt elvileg iratni az éppen sciene-ben lévő háromszögeket, azt is érdekes lenne megnézni...)

[ Szerkesztve ]

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#14) bbTamas77


bbTamas77
aktív tag

Bár a korábbi Aparapi verzióhoz képest a működésben lényegében csak az a különbség, hogy a rendszer a bájtkódot nem OpenCL-re, hanem HSAIL-re konvertálja, ami nem tűnik sok változásnak, valójában viszont komoly jelentősége van.

Szóval átfordítja byte-onként a kódokat, nesze semmi fogd meg jól, sime java-ban írt alkalmazások nem fognak gyorsabban futni semmivel sem.

(#15) Mercutio_


Mercutio_
félisten

"Aparapi API"
Ez olyan ipafai fapipás ;]

Eladó/Cserélhető: GERE Kopar faládák, ÓRA:Orient Bambino II Bigsize, FANTASY könyvek, MOSOGATÓGÉP, könyvespolcok, MOSÓGÉP

(#16) sz.balazs.95 válasza Mercutio_ (#15) üzenetére


sz.balazs.95
veterán

:C

Don't sing if you want to live long, they have no use for your song, you're dead, you're dead, you're dead, you're dead and outta this world.

(#17) bitblueduck válasza Diocles (#12) üzenetére


bitblueduck
senior tag

ugyanúgy, mint amikor egyetemen elhangzott, hogy a matlab gyorsabb assembly-nél (csak érdemes volt a hogyan értik részt is elolvasni hozzá) :N

An open mind is like a fortress with its gates unbarred and unguarded.

(#18) Jack@l válasza dabadab (#10) üzenetére


Jack@l
veterán

UI: itt olvashatsz bőven okosságokat http://www.minecraftforum.net/topic/1210436-minetest-minecraft-on-c-irrlicht-engine/
(és kipróbálható hogy futna c++-al)

[ Szerkesztve ]

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#19) Abu85 válasza Zso2 (#11) üzenetére


Abu85
HÁZIGAZDA

Mert ezek mérések. Ott ki lehetett próbálni. Az nbody ennyit gyorsult, de 16k szimulációval 12x is gyorsabb volt. Ez az oka, amiért a heterogén többmagos dizájnban látja minden piaci szereplő a jövőt.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#20) Abu85 válasza Jack@l (#13) üzenetére


Abu85
HÁZIGAZDA

Nincs olyan motor a piacon, ami a GPU-t 80%-nál jobban terhelné. Az etalon a Metro LL ~60%-kal. Még a Mantlis BF4 is ~75%-nál tetőzik, DX11.1-ben pedig ~55% körüli.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#21) Jack@l válasza Abu85 (#19) üzenetére


Jack@l
veterán

Mennyit ment only gpu-val?

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#22) Abu85 válasza Jack@l (#21) üzenetére


Abu85
HÁZIGAZDA

A HSA-s Aparapi az only GPU-t nem támogatja. Maga a rendszer koncepciója igényli a hUMA-t, a hQ-t és a Platform Atomicset. Az OpenCL-es Aparapi fut only GPU-val. Az nbody azon jól megy, gyakorlatilag Kaveri/Berlin IGP teljesítményével rendelkező GPU hozza a 10-12x-es gyorsulást. Ezzel szemben a szókeresés akármilyen GPU-val lassabb a CPU-s módhoz képest. Persze ez azért van, mert a feldolgozás 90%-a csak adatmásolás a két különálló memóriaterület között. Ezért is nincs HSA-s Aparapi dedikált GPU-ra.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#23) dabadab válasza Diocles (#12) üzenetére


dabadab
titán

Nezd meg magadnak. Nincs benne semmi kreativitas, tenylegesen gyorsabb, ha hajszallal is. Igen, en is meglepodtem, en is megcsinaltam a mereseket a sajat gepemen, nalam is gyorsabb volt.

(#13) Jack@l: "Egyszerű kockákról beszélünk, kis p*csa textúrákkal."

Igen, de pl. extreme latotavolsagnal (512 kocka) mintegy otvenmillio egyszeru kis kockarol, ami mondjuk 60 fps-sel meg egy relativ naiv megkozelitessel masodpercenket 18 milliard haromszog (most igy hirtelen a GTX 580-ra talaltam adatot, az 2 milliardot tud)

[ Szerkesztve ]

DRM is theft

(#24) Zso2 válasza Abu85 (#19) üzenetére


Zso2
őstag

...hát igen, ez az, a jövőt,csak az a baj,hogy a jelenben élünk.Ez volt a baj mindig is az AMD féle túl előremegyünk gondolkodással. Ami elméleti síkon jobb az gyakorlatban nem valósítható meg (még),mert nincsenek elterjedve azok a programok,vagy asztali megoldásoknál úgy megírt játékok,hogy ki is használnák. Aztán mit lát az user, Intelen gyorsabban mennek a játékok,jobban kihajcsáák( :) ) a vga-t.. a legtöbb konvertáló,szerkesztő progiban is bucira veri az intel ezeket a sokmagosított megoldásokat,egyszerűen legtöbben a jól bevált programokat használják.

[ Szerkesztve ]

Adelante ALONSO - Forza Ferrari | BF3-- satazso | Intel Core + Windows = Jaguar, behúzott kézifékkel.

(#25) Abu85 válasza Zso2 (#24) üzenetére


Abu85
HÁZIGAZDA

A Berlin APU egy szerverbe szánt fejlesztés. Senki sem fogja asztalba rakni. Korábban írtuk már, hogy a HSA első körben a szerverekben terjed el. Itt van a legnagyobb igény rá, illetve az Oracle is nagyon felkapta már. A többi jön sorban, de valszeg a konzol a következő, ahol ez a fajta koncepció tömegesen megveti a lábát, míg a PC lesz az utolsó. Szerintem még a mobilon is hamarabb lesz, mert az ARM-os gyártók egyetértenek, hogy a HSA-t kell tolni, és a Google is ezt akarja az OpenCL helyett.
Persze PC-n már reménysugár, hogy a Crytek elemzi a HSA-t, tehát lehet, hogy nem kell rá sokat várni. Ha mákunk van, akkor az év végére már beépítik a motorba. Ha nem, akkor csak a konzolon lesznek elérhetők az extrák.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#26) Jack@l válasza dabadab (#23) üzenetére


Jack@l
veterán

805 millió háromszöget jelent akkor, ha a pálya tele tele van kockával, és mindet megjeleníti.(pálya felét tölti fel kb) De eleve ami nincs a látótérben, azt nem fogja, és a látótávolság se fullon van. A takart kockákról már nem is beszélve, amit nem fog takarásban kirajzolni, ha jóltom.
A lényeg ott van, letöltheted, kipróbálhatod.

[ Szerkesztve ]

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#27) pakriksz válasza Jack@l (#18) üzenetére


pakriksz
őstag

nagy marhaság 2 különböző játékmotort összehasonlítani, és ráfogni hogy azért gyorsabb mert c++... ugyan azt a motort natívban és javaban kéne kipróbálni, akkor lehetne mondani valamit... ja várj, a quake2-nél kipróbálták [link]

pl most figyelek egy játékot, amit eredetileg C-ben írtak, a 2000 környéki gépekre. Most új motort fejleszettek hozzá, directx9-es, instancingos, több szálú működéssel, .net C#-ben. És gyorsabb mint a C-s játék, ergo a C lassú fos :DDD

[ Szerkesztve ]

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"

(#28) Diocles válasza dabadab (#23) üzenetére


Diocles
aktív tag

Mi volt gyorsabb? Vagy csak rossz linket adtál? Itt másról van szó, mint amit állítottál.

(#29) dabadab válasza Diocles (#28) üzenetére


dabadab
titán

Nezd meg az elfogadott valaszt, ott vannak a C-s eredmenyek is (a "Benchmarks: Core i7 920 @ 3.5 GHz" resznel)

[ Szerkesztve ]

DRM is theft

(#30) Jack@l válasza dabadab (#29) üzenetére


Jack@l
veterán

.

[ Szerkesztve ]

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#31) Diocles válasza Diocles (#28) üzenetére


Diocles
aktív tag

Ja látom, hogy a 4-ből a legagyatlanabb esetben - az egész oldal arról szól, miért ne csináld így - 8%-kal gyorsabb, az összes többiben meg lassabb. Ez azért elég kreatívan veri.

(#32) Jack@l válasza pakriksz (#27) üzenetére


Jack@l
veterán

Ugyanazt kell csinálni, megjeleníteni, most. Mért marhaság? (még mindig gagyi kockákról beszélünk, némi ai-val megspékelve)
Akkor azt mondom, volt egy java-ban valamilyen szinten programozni tudó egyén, aki az elején elkezdte írogatni, aztán azóta görgetik maguk előtt a guanot, és se normális kódot se normális nyelvre nem írták át.
Leht szűk a látóköröm, de bnem nagyon emlékszem egy AAA-s, de még AA-s játékra sem ami javaban íródott volna. (valami oknál fogva c++ a favorit, meg egypár indie jószág c#-al)

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#33) arn


arn
félisten

Ujabb feszult varakozas

facebook.com/mylittleretrocomputerworld | youtube.com/mylittleretrocomputerworld | instagram.com/mylittleretrocomputerworld

(#34) pakriksz válasza Jack@l (#32) üzenetére


pakriksz
őstag

Mert megjeleníteni sokféleképpen lehet. Ha nem így lenne, akkor 1 féle 3d motor lenne a világon, és mindenki azt használná.

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"

(#35) SylverR válasza Jack@l (#32) üzenetére


SylverR
senior tag

Chrome? Call of Juarez? (ami ráadásul az első DX10 kódot tartalmazó patchet is megkapta)
A Chrome engine JRE, és meglehet nézni milyen szép volt. De nem is kért túl nagy hardvert hozzá. :U
És vagy 10 játék is íródott rá. Ebből igaz, csak a Chrome és a COJ volt ami AAA volt.

[ Szerkesztve ]

Nem!

(#36) berVi


berVi
senior tag

Pedig itt szakertok mar elmagyaraztak, hogy ez egy halott ugy, mert 2 het alatt meg nem lattak semmi eredmenyt... :)

(#37) Xmister válasza dabadab (#29) üzenetére


Xmister
senior tag

Csak, hogy kapj normális választ is, amiből tanulhatsz:
-A C kód azért lett olyan lassú az első esetben, mert forditó optimalizáció nélkül lett forditva (ilyet értelmes ember nem csinál egy release esetén, itt is csak a kódok különbségének felhivása miatt történt).
-JAVA esetén nem állithatsz optimalizaciót, hisz az általában runtime történik a JIT által.

Tehát mi következik:
-Mindennapos esetben rosszul megirt kód esetén a C kód 10x gyorsabb lesz, mint a JAVA.
-Mindennapos esetben jól megirt kód esetén a C kód 1.5-2x gyorsabb lesz, mint a JAVA.

[ Szerkesztve ]

(#38) pakriksz válasza berVi (#36) üzenetére


pakriksz
őstag

Vagy mert 10-40% gyorsulás az "semmi" :) és még a viszbül sem veszi ki a zokszigént.

[ Szerkesztve ]

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"

(#39) dabadab válasza Xmister (#37) üzenetére


dabadab
titán

Koszonom a tanitast, de azert ennel bonyolultabb a dolog hattere, a C topikban annak idejen ki is targyaltuk ([link] + meg kesobb is elokerult).
Es igen, az -O3-mal forditott C kodot is megverte a Java.

DRM is theft

(#40) Alchemist válasza dabadab (#39) üzenetére


Alchemist
addikt

Elvileg a JIT-tel lehet csodákat tenni (a futtató környezethez való jobb adoptáció), de azért a stackoverflow-s példa elég béna volt.

Éppen olvasok egy érdekes könyvet az antigravitációról... képtelen vagyok lerakni.

(#41) leviske


leviske
veterán

Gyerekek! Nem Abu-t kell meggyőzni arról, hogy ez az egész GPGPU mizéria hülyeség. Ő híreket közöl, nem piacot diktál. Elhiszem, hogy rossz egy változást olyan részvevőjének lenni, akinek sok belszólása nincs a helyzet alakulásába, de be kell látni, hogy minden piac akkor tud ténylegesen fejlődni, ha időnként nézőpontváltáson esik keresztül. Ehhez meg először egy hardver kell, amin ezt végre kell vinni. Anno megjelenésükkor a kétmagos processzorok se pofozták a földbe valós progaromkban az egymagos verziókat, mégis azóta lett értelme még a 8 szálas cuccoknak is. Érdekes.

(#7) Jack@l: Nem vagyok IT szaki, de azért annyit én is tudok, hogy állami/ipari/kutatási viszonylatban egy-egy szerkezet árán $100.000-ket dobhat fel és le a zárójelbe fitymált képességpárosban nyújtott teljesítmény. Nem véletlen, hogy az Intel is annyit költ a MIC-re.

(#11) Zso2: A Kaveri/Mantle piacán a vásárlóknak belengetett "up to +45%" annyit tesz, hogy megfelelő programban, megfelelő összeállításban ennyit is hozhat pluszban az alap, meglévő állapothoz képest. Azaz kaphatsz ennyi pluszt ingyen, ha szerencsés vagy. Mi voltunk hülyék, hogy az "up to" részt nem vettük komolyan.

Ellenben a Berlin piacán azért az adott feladatbeli 300-1000%-os teljesítményugrásért a vásárló meg tud dolgozni megfelelő szoftverek fejlesztetésével. Ezt meg többnyire megelőzi rengeteg saját teszt, kockázatfelmérés. Senki le se szrja, hogy az AMD marketing címszó alatt mit akar lenyomni a nép torkán.

(#42) tatararpad válasza arn (#33) üzenetére


tatararpad
őstag

A nemzetközi helyzet fokozódik...

(#43) Jack@l válasza leviske (#41) üzenetére


Jack@l
veterán

Meglátjuk mennyire és mivel lesz frankó a hsa apu-n, meg mondjuk opencl gpgpu-n. (gyanítom a feladatok nagy részénél elvérzik majd az apu)
Nem a hsa ellen vagyok, sőt, eléggé szorosan követem a gpgpu-s fejlesztéseket, nagy ötletnek tartom. Ugyanakkor a hype-ot nem értem mögötte, nem lesz megváltás, nem fog minden 10x-es sebességgel működni varázsütésre. Nem vletlenül nincsenek még mindig ezerszámra ilyen programok.

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.

(#44) leviske válasza Jack@l (#43) üzenetére


leviske
veterán

Nyilván ekkora gyorsulásokat egy-egy program nem fog teljességében felmutatni, hiszen (ha jól értettem anno Fiery-t) csak egy-egy kódsor fut le ekkora plusz sebességgel a CPU-s eredményhez képest. Szóval ha eddig 1 perc volt egy program futása és ebből 20 másodpercet tett ki a gyorsított rész, akkor nyilván csak 42 másodpercre csökken a futási idő, ami azért messze nem általános 10x-es gyorsulás, függetlenül attól, hogy az adott szakasz 10x gyorsabban lefutott.

Ehhez kell hozzátenni, hogy még az AMD által kalapált képdekódoló (vagy mi volt az), amit a Kaveri kapcsán mutogattak is "csak" kétszeresére gyorsult HSA alapokra helyezve.

Programokat nem teljesen fair még várni erre egyébként, hiszen szerver/vállalati piacon még most nincs is HSA képes hardver, desktopon is csak 2 hónapja van és ott is induláskor jól le lett járatva. Erre nem lehet tömegével szoftvereket várni. Az Intel által nyomatott AVX-re sincs tudomásom szerint tömegével program, pedig van már alá mindkét oldalról hardver 2-3 éve.

(#45) Abu85 válasza leviske (#44) üzenetére


Abu85
HÁZIGAZDA

A HSA-s JPEG dekódoló nagy része nem párhuzamosítható. Abból nehéz nagy gyorsulást elérni. Annak már van amúgy egy OpenCL verziója is, de csak a nem HSA-s APU-khoz. Persze az eléggé speciális kód.

Az AVX-szel nem érdemes a HSA-t hasonlítani. Az AVX hatékony kihasználása a legtöbb cég számára vállalhatatlanul nehéz, és nem fér bele erre költeni. Egyszerűbb HSA-t vagy ma még C++ AMP-t használni és az automatikusan használ AVX/AVX2-t, kiemelten hatékony autóvektorizálással. Annál kézi optimalizálással a gyakorlatban nem lehet 10%-nál nagyobb gyorsulást elérni.

Az AVX1/2 egyébként lényeges lesz, ahogy érkezik az OCL 2, az új C++AMP és a HSA runtime. Mindhárom nagyon jól tud kódot generálni rá. Sokkal jobban, mint az Intel gyári fordítója.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#46) lenox válasza Abu85 (#45) üzenetére


lenox
veterán

Nekem meg az nem vilagos, hogy szerveren sokszalu dolgok szoktak futni, ha ilyen hsa kod van minden szalon, akkor pontosan mi fog tortenni? Mert cpu eseteben eleg jol ki van talalva, de gpu eseten eleg komolyan szoktak akasztani egymast, egy szervernel ez katasztrofa.

(#47) Abu85 válasza lenox (#46) üzenetére


Abu85
HÁZIGAZDA

Épp ezért rendelkezik a HSA runtime QoS-sel.
A Fedora elmondta, hogy a GPU mint megfogalmazás itt már rossz. Az IGP csak a nevében grafikus. Valójában pont olyan processzor, mint a Steamroller, csak más felépítésű, hogy bizonyos feladatokban sokkal hatékonyabb legyen. A mostani modellben az akadályozza a jó működést, hogy az IGP egy szolga. A HSA alapvetően azonos értékű erőforrásként tekint a CPU-ra és az IGP-re. Ez jelentősen növeli a rendszer használhatóságát.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#48) lenox válasza Abu85 (#47) üzenetére


lenox
veterán

Épp ezért rendelkezik a HSA runtime QoS-sel.

Az elmeletet ertem, a gyakorlat erdekelne. Mi tortenik a valosagban? Ha van egy szervered, ami sok klienst kell egyszerre kiszolgaljon erdemes-e ezekbe a kodokba hsa-t rakni vagy jobban jarnak a kliensek, ha nincs? Egy workstation jellegu mukodesnel vilagos, hogy erdemes, lehet tudni, hogy a usernek milyen scenarioban mire van szuksege, de egy szerver jellegu mukodesnel nincs ilyen. Oke, HSA szerint kell definialni quality of servicet, de hogy van implementalva ezen az apun? Milyen overheadje van egy context switchnek?

Az IGP csak a nevében grafikus.

Nincs az elnevezesnek jelentosege.

(#49) Abu85 válasza lenox (#48) üzenetére


Abu85
HÁZIGAZDA

Sajnos a HSA runtime QoS részét nagyon titkolják az alapítványi tagok, mert ez leginkább egy szoftveres technológia, és itt nagyon sok "mágiát" dobtak be, hogy ez működjön. Ezt a részt főleg az ARM, a Codeplay, a Canonical, az Oracle és a MultiCore Ware fejlesztette.

A Fedora eddigi gyakorlati tapasztalatai szerint sokkal jobban járnak HSA-val a kliensek. Sokkal gyorsabban van válasz a lekérésekre.

A context switch főleg a hardvertől függ. GCN-en ez veszettül gyors. Ami nincs az a grafika preempció. Az valóban nem ideális ma, hogy egy szervertől egy kliens mondjuk OpenGL munkát kér, míg egy másik valami mást.

Alapvetően van jelentősége. Sokan gondolnak még grafikára az IGP-ről, pedig ezek semmivel nem butább processzorok, mint a CPU rész.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#50) lenox válasza Abu85 (#49) üzenetére


lenox
veterán

GCN-en ez veszettül gyors.

Van rola valami doksi? En azt tudtam, hogy egy gpu contexten belul x (pl. 2) kernel kozott gyors context switch van, de ez nyilvan nem ugyanaz, mint egy szervernel sok thread, sok context kozott.

Hat szamomra nincs jelentosege az elnevezesnek. GPU-nak hivtam, mire te irtad, hogy nem is GPU, nem is jo az IGP elnevezes se. Nekem mindegy, tolem hivjuk ahogy te akarod, csak ezen ne lovagoljunk.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.