Hirdetés

2024. április 25., csütörtök

Gyorskeresés

Hozzászólások

(#1) lenox


lenox
veterán

A szimulációk alapján a gyorsítók integrációjának modelljét kiemelten díjazza az új tesztcsomag.

Ezt hol lehet latni?

(#2) Abu85 válasza lenox (#1) üzenetére


Abu85
HÁZIGAZDA

Mondták az ISC-n, hogy leginkább az adatmásolás rontja a gyorsítóknál az eredményeket. Ha nem lesz adatmásolás, márpedig integrációval nincs, akkor majdnem maximális hatékonysággal hajtható meg a rendelkezésre álló erőforrásban a gyorsító. A teszt átlagosan 10-20%-os hatékonysággal fogja be a különálló gyorsítókat, ez is attól függ, hogy van-e dinamikus parallelizmus.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#3) lenox válasza Abu85 (#2) üzenetére


lenox
veterán

A szimulációk alapján, azt irtad. Ez meg amit mondasz csak spekulacio. Amugy 20% alatt vannak a top500-ban a gyorsitokartyas megoldasok, a tobbi cpu power, szerintem tovabbra is ez lesz a jellemzo. De egyebkent mostanaban irt a ph avx 3.2-rol, meg nezd meg a skylake cache talalgatasokat, szerintem kb. egyertelmu az irany.

(#4) Abu85 válasza lenox (#3) üzenetére


Abu85
HÁZIGAZDA

Mivel már vannak olyan hardverek, amelyek mély integrációt használnak, így képesek rá szimulációkat végezni, majd a fabric rendszerek működését beleszámítva számolhatnak rá eredményeket. Ez a része spekuláció, de nem hiszem, hogy közel 40 éves tapasztalattal a hátuk mögött tévednének.

Persze egyértelmű az irány. A legnagyobb Skylake-nek majdnem a 70%-a IGP. Teljesen világos, hogy mi a jövő. Nem, erről van szó, hanem arról, hogy az új tesztcsomag milyen rendszerekkel működik hatékonyan.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#5) lenox válasza Abu85 (#4) üzenetére


lenox
veterán

Mivel már vannak olyan hardverek, amelyek mély integrációt használnak, így képesek rá szimulációkat végezni, majd a fabric rendszerek működését beleszámítva számolhatnak rá eredményeket.

Ez szerintem messze nem ilyen egyszeru, ott kezdodik, hogy sima ketprocesszoros rendszerben sem mukodik egyik sem.

A legnagyobb Skylake-nek majdnem a 70%-a IGP. Teljesen világos, hogy mi a jövő.

Nem erdemes a desktopot osszekeverni a hpc-vel, egesz mas a ketto. Gondolom, az vilagos, hogy a 70% igp az nem a 16 magos szerverprocira vonatkozik, hanem a 4 magos asztalira?

Nem, erről van szó, hanem arról, hogy az új tesztcsomag milyen rendszerekkel működik hatékonyan.

Ki lett probalva csak cpu-val, cpu+nv gyorsitoval es cpu+intel gyorsitoval. Parezer, partizezer, parszazezer egyeb mely integralt maggal nem volt kiprobalva, ha jol ertem, ugye?

(#6) Abu85 válasza lenox (#5) üzenetére


Abu85
HÁZIGAZDA

Fabric mellett miért kellene úgy működniük?

Pedig érdemes. A HPC feladatra jobb lesz a desktop Skylake, melynek egyébként lesz szerver verziója.

De ki lett próbálva tesztrendszerekkel. A SeaMicro rendelkezik Berlin tesztrendszerrel, de sample hardvereket is kipróbáltak már. Az a helyzet, hogy 40 éves tapasztalatuk van ebben a hardverek képességének felmérésben. Kicsi az esélye, hogy tévednek.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#7) lenox válasza Abu85 (#6) üzenetére


lenox
veterán

Fabric mellett miért kellene úgy működniük?

Hat csak mert a fabricnak is van koltsege, meg nem mindegy, hogy ugyanaz a teljesitmeny tobb vagy kevesebb node-dal oldhato-e meg, ezert a per node teljesitmenyt is esszeru kereteken belul maximalizalni akarjak, ugyhogy mindenki multiprocesszoros rendszereket hasznal. Lehet azt gondolni, hogy a mely integracio kedveert atallnak single processzorra, de nem hinnem. Ennel sokkal valoszinubb, hogy valaki csinal multiprocesszoros apus rendszert, felteve, hogy valami miatt jo lenne aput hasznalni.

A HPC feladatra jobb lesz a desktop Skylake, melynek egyébként lesz szerver verziója.

Szerintem nem lesz jobb. A cpu magokat konnyebb programozni, es flexibilisebben hasznalhatoak, ugyhogy ha a 4 magos desktopot hasonlitom a 16 magos szerverprocihoz, akkor ahhoz, hogy egyaltalan gondolkozni megerje rajta, hogy esetleg jobb lenne-e, jelentosen gyorsabbnak kene lennie az igp-nek, mint a 12 skylake magnak. Szoval mondjuk 24 skylake mag teljesitmenye eseten lehet gondolkozni. Fog tudni ennyit? Nem hinnem.

Az a helyzet, hogy 40 éves tapasztalatuk van ebben a hardverek képességének felmérésben. Kicsi az esélye, hogy tévednek.

Ezek szerint vannak valamilyen adatok. Tudsz mutatni?

(#8) Abu85 válasza lenox (#7) üzenetére


Abu85
HÁZIGAZDA

Ez a fabric esetében nem gond. Annyi processzort rakhatsz egy modulra, amennyi ráfér az alaplapra. Ezért megy mindenki a fabric felé, mert modul szinten is jóval kevesebb limitációt jelent, mint a hagyományos forma.

Igazából a legnagyobb ellenérv, amit minden fejlesztőtől hallok az AVX-szel kapcsolatban, hogy nehéz programozni. Jóval nehezebb, mint a GPGPU-t, legalábbis a TLP-seket. Lehet, hogy ezért van csak pár maréknyi AVX-et kihasználó program, miközben több száz GPGPU-t támogató alkalmazás létezik már.

Feltételezem, hogy nem a levegőbe beszélnek egy ISC előadáson. Főleg nem a saját programjukról.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#9) polika válasza Abu85 (#8) üzenetére


polika
senior tag

Nem akarok beleszolni a szakmai részbe, mert nem értek hozzá. Az érvelésed viszont viccess "Feltételezem, hogy nem a levegőbe beszélnek egy ISC előadáson. Főleg nem a saját programjukról."

Olyan mintha azt mondanád hogy a kofa aki saját árúját óbálja eladni a piacon az megmondja a tuttert és hát hülye aki nem hisz neki, hát a saját portékáját már csak ismeri...na persze ismeri is, de mondjuk úgy hogy nem elfogulatlanul fog róla beszélni, és legjobb esetben nem hazudik, csak max nem mondja el azt ahol szar, hanem arról beszél amiben jó.

(#10) Abu85 válasza polika (#9) üzenetére


Abu85
HÁZIGAZDA

Ez nem áru. Ezt nem kell eladniuk. Ez egy program, ami segít meghatározni, hogy az adott szuperszámítógépnek mekkora a teljesítménye. A saját Linpack programjuknak a leváltója, mert úgy gondolják, hogy ez már nem ideális a teljesítmény mérésére. Az új programnak nincs ellenfele, senki sem fog előjönni azzal, hogy a mi benchmarkunk jobb, mert nem készül másik program. Ők csak azt mondták el, hogy a mai szuperszámítógépekben mik jelentik a limitációt az új programban. Az egyik a fabric, míg a másik az adatmásolás a gyorsítók különálló memóriájába. A fabricra jobb megoldások kellenek, míg az adatmásolást kiüti az integráció. Nem állítottak olyat, amire már a világ összes itt érdekelt gyártója ne jött volna rá, mert fejlődik a fabric és mélyül el az integráció.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#11) lenox válasza Abu85 (#8) üzenetére


lenox
veterán

Ez a fabric esetében nem gond.

Nincs ilyen, hogy 'a fabric'. A fabric egy az adott rendszerben alkalmazott halozati strukturat/topologiat/rendszert jelenti. Mindegyiknel mas megoldas van, a k computer eseteben pl. 6 dimenzios torus, masoknal 2-3-5 dimenzios, esetleg mas. Van, ahol kartyan keresztul kapcsolodik switchbe, van ahol fel van rakva az alaplapra. Mi a hagyomanyos, amit szuperszamitogepekben alkalmaznak es nem ez? A node-ok szama mindenhol szamit.

Igazából a legnagyobb ellenérv, amit minden fejlesztőtől hallok az AVX-szel kapcsolatban, hogy nehéz programozni. Jóval nehezebb, mint a GPGPU-t, legalábbis a TLP-seket.

Milyen fejlesztoktol hallod ezt? Csak mert aki hasznalja pl. a megfelelo intel libeket, az automatikusan megkapja a gyorsitast. Pl. ez az uj benchmark is hamarabb volt kesz cpu-ra, mint gyorsitokartyara. Desktopon amugy legtobb cpu-n nem elerheto az avx, ez lehet ellenerve, de a mai xeonok tudjak, tehat hpc-nel nem erv.

Ők csak azt mondták el, hogy a mai szuperszámítógépekben mik jelentik a limitációt az új programban. Az egyik a fabric, míg a másik az adatmásolás a gyorsítók különálló memóriájába.

A mai szuperszamitogepeknek kevesebb, mint 20%-aban van gyorsitokartya, amiben tehat nincs, ott nem is lehet limitacio az adatmasolas. Masik dolog, hogy valamilyen lapkaval is elo kellene allni ahhoz, hogy a mely integracio alkalmazasan lehessen gondolkozni, a jelenlegiek gyengebbek, mint egy skylake lesz. Persze az meg 2 ev, mire kijon belole xeon, szoval nem lehetetlen megcsinalni, az amd-nek meg is van a tudasa hozza, csak nem latom, hogy mitol erne meg nekik a jelenlegi minimal szerver cpu eladasbol. Mert az intel barmit fejleszt azt el tudja adni mashova is, tehat ott latom, hogy megeri.

(#12) Abu85 válasza lenox (#11) üzenetére


Abu85
HÁZIGAZDA

A fabric minden esetben ugyanolyan elvek szerint működik. Persze megvan mindenkinek a maga titkos összetevője, ami természetesen az összeköttetés milyenségében rejlik, de az alapelv minden esetben ugyanaz, vagyis kapcsolj össze nagyon sok node-ot hatékonyan.

Például az Adobe. Ők azért nem támogatják az AVX-et, mert túl nehéz kihasználni.
Ha a piaci részesedésre akarod ezt a kérdést lebontani, akkor a legtöbb GPU-n nem elérhető Mantle, mégis 50+ fejlesztő dolgozik már rá (ez majdnem a teljes PC-s AAA-s fejlesztőbázis). Ha valami egyszerűen használható, és olcsón beépíthető, akkor arra rárepül a piac. Persze nem ugyanaz a kettő, de világosan mutatja a helyzet, hogy a piaci részesedés nem döntő tényező.

Mondta valaki, hogy ott limitáció?
Inkább három év még a Skylake Xeon. Mert a következő évben lesz Haswell, utána Broadwell, és csak utána soros a Skylake. De a Skylake IGP-s sima verziójából már jövőre lesz Xeon.

Azt is érdemes kiemelni, hogy Európa olyan szuperszámítógép projektet vázolt fel, amely ARM magokat és Mali IGP-t használ. Összerakják maguknak a lapkát és kész. A jövőben amúgy is a magánlapkák kerülnek a középpontba. Nem véletlenül mozdult rá az Intel a bérgyártásra. Nem fogják tudni megakadályozni, hogy a Google, a Facebook, az Amazon és még mások saját lapkákat tervezzenek a szervereikbe. Legalább azt érjék el, hogy legyárthassák azokat.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#13) lenox válasza Abu85 (#12) üzenetére


lenox
veterán

Például az Adobe.

Nem ertem, nekik milyen szuperszamitogepuk van, es mit csinalnak vele?

Azt is érdemes kiemelni, hogy Európa olyan szuperszámítógép projektet vázolt fel, amely ARM magokat és Mali IGP-t használ.

Persze, hajra, mindig lehet valamivel probalkozni. Szerintem gyengebb lesz, mintha az intellel szovetkezve csinalnak, de nyilvan meger valamennyi aldozatot, ha fuggetlenek tudnak lenni valamennyire.

(#14) Abu85 válasza lenox (#13) üzenetére


Abu85
HÁZIGAZDA

Semmi. Az AVX támogatását általánosan értette, ahogy a GPGPU-ét is.

Még az se biztos, hogy rosszabbak lesznek. Performance/watt szinten simán élmezőny.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#15) lenox válasza Abu85 (#14) üzenetére


lenox
veterán

Semmi. Az AVX támogatását általánosan értette, ahogy a GPGPU-ét is.

Nem tudom miert kene az avx-et altalanosan tamogatni ahhoz, hogy supercomputerben hasznalhato legyen.

Még az se biztos, hogy rosszabbak lesznek. Performance/watt szinten simán élmezőny.

En ugy latom, hogy a peak performance alapjan szamolt flop/wattban is kb. 55-60. helyre ferne fel a green500 listan, ahol a mert eredmenyek vannak, szoval a valosagban 100 folott lenne, tehat minden mai kombinacio veri. De persze lehet, hogy mar mindjart jo lesz, csak nem latom, miert gondolnam azt, hogy masok nem fejlesztenenek ugyanolyan mertekben.

(#16) Abu85 válasza lenox (#15) üzenetére


Abu85
HÁZIGAZDA

Az általános támogatása valaminek jelzi, hogy mennyire könnyű programozni.

Jelen hírben arról van szó, hogy a Linpack már nem alkalmas a teljesítmény meghatározására, mert nem vesz figyelembe olyan kritikus tényezőket, mint a rendszerfabric hatékonysága és az adatmásolás lassító tényezője.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#17) lenox válasza Abu85 (#16) üzenetére


lenox
veterán

Az általános támogatása valaminek jelzi, hogy mennyire könnyű programozni.

Ez szep, nem tudom, ennek mi a jelentosege, biztos lehetsz benne, hogy hpc-hez ettol meg hasznaljak.

Jelen hírben arról van szó, ... és az adatmásolás lassító tényezője.

Igy van, ehhez eleg szorosan kapcsolodik, hogy ezt hogy erdemes megoldani, egyik irany igp, masik cpu power, en csak mondom, hogy nincs olyan igps lapka, ami labdaba tudna rugni ezen a teruleten, ugyhogy az adatmasolas azon megoldasa, hogy lam nem kell masolni, mert a mely integracio megoldja csak egy latszatmegoldas, nincs mibol ilyen rendszert epiteni, ami hatekony lenne.

(#18) Abu85 válasza lenox (#17) üzenetére


Abu85
HÁZIGAZDA

Az IGP-k esetében miért vesszük ki a Berlin Opteront, vagy az érkező Broadwellt és Skylake-et?

A CPU-power egyébként nem fog akkor hatékonyságot adni, mint az IGP. A CPU-k átlagos pJ/FLOP mutatója 1500, míg az IGP-ké 200. Világos, hogy melyikből lehet nagyobb teljesítményt pakolni egy lapkába.

Azt hiszem, hogy az az irány, hogy mindenki bőszen integrál, és próbálja megoldani ennek elmélyítését egyenes beismerés arra vonatkozóan, hogy azonos fogyasztás mellett az IGP egyszerűen nagyságrendekkel nagyobb számítási teljesítményre képes.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#19) lenox válasza Abu85 (#18) üzenetére


lenox
veterán

A CPU-power egyébként nem fog akkor hatékonyságot adni, mint az IGP. A CPU-k átlagos pJ/FLOP mutatója 1500, míg az IGP-ké 200. Világos, hogy melyikből lehet nagyobb teljesítményt pakolni egy lapkába.

Mar nem emlekszem, hogy honnan jonnek ezek a szamok, de a mai teny az az, hogy egy ivy xeon mag 11 wattbol kb. fele annyi flopot tud csinalni, mint egy gcn mag kb. fele annyi wattbol, tehat az arany mar ma ketszer jobb, mint amit irsz, skylake-nel meg meg tobb, mint ketszer lesz jobb. Ezen kivul mar csak azt kell tudni, hogy ebben nincs beleszamolva az osszes tobbi fogyaszto, ugy mint pl mem, kommunikacio, hutes. Szoval nem erdemes ezekkel a szamokkal nyomulni, mert nem latod a fatol az erdot.

Azt hiszem, hogy az az irány, hogy mindenki bőszen integrál, és próbálja megoldani ennek elmélyítését egyenes beismerés arra vonatkozóan, hogy azonos fogyasztás mellett az IGP egyszerűen nagyságrendekkel nagyobb számítási teljesítményre képes.

Igy van, es ez mobilba, desktopba, medialejatszoba es meg ezer helyen tok jo. HPC-be is lehetne jo, ha megfelelo lapkat gyartana valaki, de meg nem gyart, es nem is latom, kinek erne meg kifejleszteni, amint mar irtam.

(#20) Abu85 válasza lenox (#19) üzenetére


Abu85
HÁZIGAZDA

Az NV mérte ki régebben.
Ahhoz képest nagyon csúnyán messze van x fogyasztás mellett a Xeon GFLOPS mutatója az ugyanannyit fogyasztó GCN-től.
Nézzük csak meg ...
E7-8890 v2 - 896 GFLOPS és 155 watt
Radeon R9 270 - 2368 GFLOPS és 160 watt
A kettő közül az egyik skálázódik is. ;)

Berlin APU miért nem felel meg? Vagy a Broadwell és a Skylake?

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#21) lenox válasza Abu85 (#20) üzenetére


lenox
veterán

Nem vagyok benne biztos, hogy ertetted. En azt irtam, hogy negyszeres orajelen egy ivy mag kb. fele annyi flopot tud, mint egy gcn mag fele annyi wattbol, tehat kb. negyede a hatekonysaga. Te most megmutattad, hogy valojaban nem 1:4-hez az arany, hanem 1:2.56-hoz, tehat meg sokkal jobb, mint en allitottam. Te ugye eredetileg 1:7.5-ot mondtal, aminel ezek szerint (a te allitasod) ma 3-szor jobb a helyzet. De mondom, skylake meg a maihoz kepest 2-szer jobb lesz, tehat akkor lenne 1:1.28-hoz az arany. Ez mar az a szint, amikor teljesen felesleges apuval probalkozni, sokkal jobb cput hasznalni, mivel ugysem minden tud illeszkedni az igp-s feldolgozashoz, masreszt az apuban se 20 gcn mag lenne, hanem gondolom 4 cpu modul, meg 12-16 gcn mag, vagy esetleg 20, de akkor meg ehhez kepest alulclockolva, szoval amugy sem tudna ennyit az igp-je.

Berlin apunak nem tudom a specifikaciojat, broadwellben tudtommal nem lesz 512 bites avx, a skylake-re meg irtam, hogy akkor hinnek benne, hogy az igp-je eleg eros lehet, ha peak performance-ban legalabb ketszeresen veri azokat a magokat, amiket miatta ki kellett szedni. Tehat ha 16 magos skylake helyett 4 magos lesz igp-vel, akkor az igp-nek 12*2=24 mag teljesitmenyet kene hozni ahhoz, hogy jo legyen. Nem hinnem, hogy fog tudni ennyit, de ha igen, akkor jo lehet. Ugyanez igaz amd-re is, ha a 4 modul (8 mag) melletti igp tud joval 2 TFLOPS folott menni, akkor lehet beszelgetni. Jelenleg tudtommal ilyen nincs, ehhez a szamitasi teljesitmenyhez tobb, mint 200 watt kell az amd-nek is, ami nagyjabol 50%-kal tobb, mint kene. Ugyhogy az eddigi adatok alapjan a skylake xeon a nyero cpu magokkal.

(#22) Abu85 válasza lenox (#21) üzenetére


Abu85
HÁZIGAZDA

Ha APU-t nézünk, akkor a Berlin 35 wattból tud 700 GFLOPS-ot, ami majdnem annyi, mint amennyit a leggyorsabb Xeon tud 155 wattból. Ja teljesen felesleges ezzel próbálkozni.

A Berlin APU az egy FX-7600P csak magasabb órajelekkel.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#23) lenox válasza Abu85 (#22) üzenetére


lenox
veterán

Ne altasd magad, ez ugyanaz a technologia, azt a minimalis hatekonysagbeli elterest az intel is bele tudja tuningolni, tehat ez sem lesz 1.5-szeresnel jobban energiahatekony a skylakehez kepest, tehat nem eri meg. Ugye nem felejted el, hogy a mem, a fabric, a hutes stb is fogyaszt, tehat az egesz rendszerre nezve nem ez az arany, mint ahogy a feladatok egeszere nezve se ez az arany, hanem csak a masszivan parhuzamosithato reszere. Szoval igen, ez meg keves lesz. De lehet meg fejleszteni, csak mint mar mondtam nem latom, hogy ide lenne-e erdemes az amd-nek a fejlesztesi penzt tenni.

(#24) namaste


namaste
tag

Nem váltják le a HPL-t, nem is szándékoznak. HPCG a memória elérésre és a gépek közötti kommunikációra helyezi a hangsúlyt. A HPL-hez is kell gyors memória és összeköttetés, igaz kevesebbet számít.

A GPGPU-k egyszerre tudnak dolgozni és adatot másolni a PCIe-n keresztül. Amíg a kártya dolgozik, addig az előző (rész)feladat eredményét lehet letölteni és a következő (rész)feladat adatait feltölteni. Ezenkívül a GPU is indíthat kernelt, GPU-k közvetlenül adatot cserélhetnek hálózaton keresztül. Ezekkel lehet mérsékelni a PCIe késleltetését. CPU-GPU megosztott memóriával hatékonyabb lesz és kevesebb energiát fogyaszt majd.

ARM szerverről van mérési eredmény? A Midgard ALU teljesítménye 17 SP FLOPs illetve 5 DP FLOPs órajelenként.

A MFLOPS/Watt értéket át lehet számolni pJ/FLOP értékre, TOP500 alapján:
Xeon+K20 3400 MF/W ~ 294 pJ/FLOP
Xeon 1200 MF/W ~ 833 pJ/FLOP

(#25) Abu85 válasza lenox (#23) üzenetére


Abu85
HÁZIGAZDA

Minden bele van tuningolva abba a Xeonba. Egyszerűen sokkal energiahatékonyabbak tudnak lenni GPU-kkal. Ezt az Intel is felismerte, amikor elindultak a Larrabee felé, csak rossz irányból közelítik meg, azért nincs eredménye 2003 óta.

A memória az zömében ugyanaz mindenkinél, míg a fabric az valóban fogyaszt. Az lesz előnyben, aki be tudja integrálni a SoC-ba.

Nagyon is van értelme ide pénzt tenni, amikor a legtöbb futtatott feladat nagyon díjazza a gyorsítókat.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#26) lenox válasza Abu85 (#25) üzenetére


lenox
veterán

Minden bele van tuningolva abba a Xeonba. Egyszerűen sokkal energiahatékonyabbak tudnak lenni GPU-kkal.

Hat egyreszt a 3x az eleg sokkal szerintem is, masreszt meg az a xeon teljesitmenyre van kihegyezve, mig amit te ellene felhoztal, az alacsony fogyasztasra, szoval nem volt fair egyaltalan. Ennel tud az intel is jobbat, ivy xeonok kozul van ennel 30%-kal jobb energiahatekonysagban, haswell xeonokbol meg lesz 50%-kal jobb (ugy ertem mar van, csak nem kaphato meg).

Nagyon is van értelme ide pénzt tenni, amikor a legtöbb futtatott feladat nagyon díjazza a gyorsítókat.

Csak arra nem gondolsz, hogy veges penz, es sok irany van, egyszerre mindet nem lehet tamadni.

(#27) Abu85 válasza lenox (#26) üzenetére


Abu85
HÁZIGAZDA

Vannak alacsony fogyasztású Xeonok is abból a sorozatból. Le van tiltva a magok több mint fele.

Fejlesztesz egy lapkát és berakod mindenhova. Nem nagy kunszt ez ma sem. Amire figyelni kell az a performance/watt, mert ma ez a legfontosabb minden területen.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#28) lenox válasza Abu85 (#27) üzenetére


lenox
veterán

Persze, es nyilvan ugyanaz a felepites nyero telefonban is, meg szupercomputerben is.

[ Szerkesztve ]

(#29) Abu85 válasza lenox (#28) üzenetére


Abu85
HÁZIGAZDA

Nem vagyunk messze attól, hogy ez a nézet általános legyen. :)

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#30) lenox válasza Abu85 (#29) üzenetére


lenox
veterán

Tudom, amd szemuveggel nem is lehet ez maskent, mivel mas eselyuk nincs. :)

(#31) Abu85 válasza lenox (#30) üzenetére


Abu85
HÁZIGAZDA

Milyen AMD? Szó sem volt itt róluk. Itt egy irányról van szó, ami a GPU integrálása a CPU-ba. Mindenki csinálja. Nem tudsz egy olyan céget mondani, aki nem ilyen lapkákat tervez. Egyszerűen ez a jövő. Már az Intel is ezt mondja. Igaz, hogy az elmúlt tíz évben ők tévedtek a legtöbbet a jóslásnál, de nyilván emiatt megvan az az előnyük, hogy ők kipróbálták azokat az irányokat is, amelyekre más helyből rámondta, hogy nem működik. Ergo most szerintem nem tévednek, amikor az integrációra teszik fel a pénzt. Csak az a kár, hogy ezt már számos sztárfizetéssel leigazolt mérnökük megmondta nekik az előző évtizedben, és cserébe kirúgták mind.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#32) lenox válasza Abu85 (#31) üzenetére


lenox
veterán

Akkor csak en kevertem ossze a Radeont meg a Berlin aput valamivel :).

Nem tudsz egy olyan céget mondani, aki nem ilyen lapkákat tervez.

Intel, Oracle/Fujitsu, IBM, csak akik jatszanak hpc temaban.

(#33) Abu85 válasza lenox (#32) üzenetére


Abu85
HÁZIGAZDA

Meg volt említve a Skylake és a Broadwell is.

Az Intel pont ilyeneket tervez a jövőben. Az IBM és az Oracle terveiről még nem tudsz mindent. Az IBM speciel azért nyitotta meg a Power8-at, hogy azt licencelhessék a cégek és kiegészíthessék a lapkát IGP-vel. Ők is koncentrálnak erre, csak nincs meg a technológiájuk, hogy lefedjék a piacot. Az Oraclenek is vannak ilyen tervei, de ők inkább licencelnének architektúrát. Egyelőre viszont a HSA-ra készítik fel a szoftvereiket és csak utána dolgoznak a hardveren, de a HSA támogatása az kiemelt projekt.

(#34) lenox: Sokkal reálisabb a Power8+Tesla integrálva. Ne feledd, hogy hiába rakod a magot a lapkákba, ha az ISA nem skálázódik egy bizonyos szintnél tovább.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#34) lenox válasza Abu85 (#33) üzenetére


lenox
veterán

Persze, mert lesz ilyen igeny is. Csak azt kell latni, hogy nem kizarolagosan, es nem minden temaban. Persze mindenki csak olyanra tud loni, amire van technologiaja, ezert latom en az intelt befutonak.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.