Hirdetés

2024. május 2., csütörtök

Gyorskeresés

Hozzászólások

(#45) Abu85 válasza leviske (#44) üzenetére


Abu85
HÁZIGAZDA

A HSA-s JPEG dekódoló nagy része nem párhuzamosítható. Abból nehéz nagy gyorsulást elérni. Annak már van amúgy egy OpenCL verziója is, de csak a nem HSA-s APU-khoz. Persze az eléggé speciális kód.

Az AVX-szel nem érdemes a HSA-t hasonlítani. Az AVX hatékony kihasználása a legtöbb cég számára vállalhatatlanul nehéz, és nem fér bele erre költeni. Egyszerűbb HSA-t vagy ma még C++ AMP-t használni és az automatikusan használ AVX/AVX2-t, kiemelten hatékony autóvektorizálással. Annál kézi optimalizálással a gyakorlatban nem lehet 10%-nál nagyobb gyorsulást elérni.

Az AVX1/2 egyébként lényeges lesz, ahogy érkezik az OCL 2, az új C++AMP és a HSA runtime. Mindhárom nagyon jól tud kódot generálni rá. Sokkal jobban, mint az Intel gyári fordítója.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.