Hirdetés

2024. május 3., péntek

Gyorskeresés

Hozzászólások

(#16) Abu85 válasza Petykemano (#2) üzenetére


Abu85
HÁZIGAZDA

Linpack mérés. De az AMD FP16-ot mér, míg a green500 az FP32-es. Így ez nem összehasonlítható, a tesztkörülmény sem ugyanaz. Lásd: [link]

(#15) SaGaIn: Nagyon jó a HIPify hatásfoka. Elég jó éles példa volt a CAFFE nevű deep learning keretrendszert Tip verziójának a portolása CUDA-ról. Ezt HIP-re négy nap alatt megcsinálták. A kód 99,6%-a lett automatikusan konvertálva. Úgy 54000 sornyi kód teljesen érintetlen maradt, mert a CUDA és a HIP lényegében ugyanaz magas szinten. Nagyjából ezer sor változott a konvertálással, míg manuálisan nagyjából száz sorhoz kellett hozzányúlni. A négy nap alatt így kapott eredmény ugyanolyan gyors volt, mint a CUDA kód (ugye a HIP fut GeForce-on is), és minden funkciója ugyanúgy működött. Az OpenCL portnál lényegesen gyorsabb volt, holott utóbbi 32000 sor manuális átírását igényelte.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.