Hirdetés

2024. május 4., szombat

Gyorskeresés

Hozzászólások

(#1) MaUser


MaUser
addikt

A rendszert C/C++ (GCC 7.2), OpenCL, OpenMP, OpenSHMEM, MPI, Erlang és Python nyelveken keresztül lehet programozni.

Az OpenMP, OpenSHMEM és MPI nem programozási nyelvek, hanem párhuzamosítást (core-ok, node-ok között) lehetővé tévő api-k (amik mögött ugye ott vannak a kész lib-ek is). Pl. Python-ban lehet mpi-al párhuzamosítani végrahajtást node-ok között. (magok között ugye van built-in support). Openmp pedig ahol tud, "automatizálja" a többmagos végrehajtást (tipikusan embarrassingly parallel problémáknál). De a gyakorlatban már annyira bővítettek ezek az utasításkészletek, hogy szinte mindegyik tud már mindent.

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''

(#2) sTERNI


sTERNI
senior tag

"a téglalap alakú forma a kör alakú wafereken kevesebb hibás lapkát fog eredményezni a gyártás során."

Valaki meg tudja mondani, hogy ennek vajon mi lehet az oka?

"You travel with fascinating companions, Doctor."

(#3) szmörlock007 válasza sTERNI (#2) üzenetére


szmörlock007
aktív tag

Lifehack :DDD

(#4) Petykemano


Petykemano
veterán

Akkor a GPU-knak és a Xeon Phinek leáldozott a HPC piacon?

Találgatunk, aztán majd úgyis kiderül..

(#5) griffhun válasza sTERNI (#2) üzenetére


griffhun
csendes tag

A matematika. ;)
(Nagyobb lefedettseget tudsz elerni a kor szeleinel egysegnyi teruletu teglalapokkal mint negyzetekkel.)

(#6) Dr.Momo válasza Petykemano (#4) üzenetére


Dr.Momo
tag

Nagyon úgy tűnik. A legzöldebb gépek is jelenleg 6-7 Gflops/W között vannak, ez pedig dupla pontosság mellett is 100Gflops/W-ot. Ez több mint 1 nagyságrenddel hatékonyabb.

(#7) ppeterka válasza Dr.Momo (#6) üzenetére


ppeterka
tag

Ezek szerint most éri meg kiszállni a GPU bányászatból - ha ez beindul, lesz megint olcsó VGA...

(#8) szmörlock007 válasza Dr.Momo (#6) üzenetére


szmörlock007
aktív tag

"A legzöldebb gépek is jelenleg 6-7 Gflops/W között vannak"

A jelenlegi green500 rangsort egy 14 Gflops/W -os gép vezeti. De egyébként ez így igazságtalan összehasonlítás. Ugyanis a komplett gép nyilván rosszabb energiahatékonyságú lesz mint egy chip. Nézd csak meg a szuperszámítógépeket. Többnyire ott is a "kisebb" gépek az energiahatékonyabbak.

Például az Amd vega 10-re épülő Radeon Instinct MI25 fp 16-os pontosságban vagyis deep learninges feladatokban 82 Gflops/W hatékonyságú egymagában. Az nvidia tesla v100 pedig a tensor magokkal 8 bites pontosság (mátrixműveletek) alatt 120 Tensor Tflops/W érhető el ami 400 Gflops/W.

Ezzel együtt természetesen az Epiphany-V gyorsító igen igéretes. :)

[ Szerkesztve ]

(#9) Petykemano válasza szmörlock007 (#8) üzenetére


Petykemano
veterán

Egész különös, hogy itt a PEZY, meg ez az epiphany is, amik tulajdonképp a semmiből kinőtt gyorsítók.
És ha nem is nagyságrendekkel, de azért jobbak, mint amit az intel összekalapált Xeon Phi, az AMD vagy az nvidia GPU-i, vagy amit eddig bármelyik cégnek sikerült ARM alapokon összedobnia. Persze értem, nyilván biztosan más egy általános célű CPU-ból, vagy egy (GP)GPU-ból gyorsítót csinálni, mint egy direkt arra tervezett hardverből kiindulni, de akkor is

Találgatunk, aztán majd úgyis kiderül..

(#10) awexco válasza Petykemano (#9) üzenetére


awexco
őstag

Baltával te hogy tudsz ásni pl ? :) céleszköz ... vagy svájci bicska ami mindenre jó de mégse :)

I5-6600K + rx5700xt + LG 24GM77

(#11) Dr.Momo válasza szmörlock007 (#8) üzenetére


Dr.Momo
tag

:R

(#12) Reggie0 válasza griffhun (#5) üzenetére


Reggie0
félisten

Ez meg nem magyarazat. Ha csak egy chipet raknak a wafer kozepere, akkor is ugyan annyi lesz a hibas, mert a meghibasodasi valoszinuseg elvileg csak a felulet nagysagatol fugg. Itt valami mas turpissag lehet, vagy rossz a forditas :)

(#13) awexco válasza Reggie0 (#12) üzenetére


awexco
őstag

Szerintem minél nagyobb a chip átlója annál nagyobb a valószínűsége ,h kevesebb chipre esnek a hibák .

I5-6600K + rx5700xt + LG 24GM77

(#14) Z10N válasza Petykemano (#9) üzenetére


Z10N
veterán

Kulcsszo: DARPA :)

# sshnuke 10.2.2.2 -rootpw="Z10N0101"

(#15) Reggie0 válasza awexco (#13) üzenetére


Reggie0
félisten

Miert az atlojatol fugg?

[ Szerkesztve ]

(#16) ddekany válasza Dr.Momo (#6) üzenetére


ddekany
veterán

Lehet, hogy nem sokat érnek ezek a Gflops/W számok, mert nem egy adott valós feladatról van szó, aminél összevethetők lennének a megoldások. Gondolom a 100 GFlops/max az a maximum, amikor miden mag a saját kis privát memóriájában pörget valamit a végtelenségig.

[ Szerkesztve ]

(#17) szmörlock007 válasza Z10N (#14) üzenetére


szmörlock007
aktív tag

Pontosan :)

#9 Petykemano: "Egész különös, hogy itt a PEZY, meg ez az epiphany is, amik tulajdonképp a semmiből kinőtt gyorsítók.
És ha nem is nagyságrendekkel, de azért jobbak, mint amit az intel összekalapált Xeon Phi, az AMD vagy az nvidia GPU-i, vagy amit eddig bármelyik cégnek sikerült ARM alapokon összedobnia."

Igazából szerintem ebben nincs semmi varázslat."Csak"nagyon jó mérnökök kellenek. Nyilván nem az amd, intel, nvidia cégeknél van a világ összes jó képességű villamosmérnöke.

[ Szerkesztve ]

(#18) namaste


namaste
tag

Ez a magyarázat a téglalap alakra:
The strong deviation from a “square die” was due to the aspect ratio of the SRAM macros and 16nm poly vertical alignment restriction.
e5_1024core_soc.pdf

Az egyes magok mellé két oldalról helyezik el a SRAM blokkokat, így téglalap alakot kapunk és ezeket rakják 32 x 32-es rácsba.

(#8) szmörlock007
A Tesla V100 Tensor Cores FP16/FP32 pontosságú, a Google TPU és az MS FPGA megoldása 8 bites.

(#19) awexco válasza Reggie0 (#15) üzenetére


awexco
őstag

Azonos terület mellet minél nagyobb az átló annál nagyobb az esélye , hogy két távolabbi pont egy kockába essen . Nagyon leegyszerűsítve. Van már egy oldal arány ahol ez visszaesik ha nagyon keskeny.

Picit mellébeszélés ez mert mikor megtervezik nem tudják hogy hol lesznek hibás pontok a gyártósoron . Bár statisztikából kiszámoltatják milyen oldalarány a legideálisabb x hibás pont esetén . De ezt sem fogják tudni előre.

Kis hibaarány mellett nincs túl nagy jelentősége . Nagy hiba arány mellett lehet ennek előnye.

Erre a tökéletes válasz : Valójában igen de effektíve nem :DDDD

[ Szerkesztve ]

I5-6600K + rx5700xt + LG 24GM77

(#20) RozogA87


RozogA87
tag

Javítsatok ki ha tévedek, de a RISC nem a csökkentett utasításkészletre vonatkozik? Magyarán ez olyan mint egy qrvagyors celeron?! Amúgy mit gyorsít mint "gyorsító", ez nem processzor hanem grafikus chip? Más: ez már lepipálja magszámban a görögdinnyét?

Az intelligens emberek hajlamosabbak a mentális betegségekre. Állítják a hangok a fejemben.

(#21) ddekany válasza RozogA87 (#20) üzenetére


ddekany
veterán

Ez kb. olyan mint 1024 darab, Celeronnál sokkal egyszerűbb CPU, mind saját kicsi memóriával. Ez egy koprocesszor, azaz kell mellé rendes CPU is, és erre csak a direkt erre írt, erősen párhuzamosítható programrészeket tolják fel.

[ Szerkesztve ]

(#22) Petykemano válasza ddekany (#21) üzenetére


Petykemano
veterán

Még mindig kiváncsi lennék, hogy egy közös memória címterű (interposerrel) egybetokozott Ryzen/Epyc és 16GB HBCC gyorsítótáras Vega hogy menne ?
Persze ebből a szempontból minden a szoftver. Ha nincs, semmivel nem jobb, mint ha pcie/nvlink csatlakozás lenne.

Találgatunk, aztán majd úgyis kiderül..

(#23) RozogA87 válasza ddekany (#21) üzenetére


RozogA87
tag

Jaaa! :C

Az intelligens emberek hajlamosabbak a mentális betegségekre. Állítják a hangok a fejemben.

(#24) Reggie0 válasza awexco (#19) üzenetére


Reggie0
félisten

Igen, viszont a masik iranyban pedig annal kisebb a valoszinusege. Amit irsz az alapjan mindennek negyzetnek kene lennie. Na majd utanaolvasok a temakornek mert eleg erdekes.

(#25) awexco válasza Reggie0 (#24) üzenetére


awexco
őstag

Sikerült utána olvasni ?

I5-6600K + rx5700xt + LG 24GM77

Copyright © 2000-2024 PROHARDVER Informatikai Kft.