Hirdetés

2024. május 2., csütörtök

Gyorskeresés

Hozzászólások

(#1) nakos1212


nakos1212
senior tag

"A Scorpio kódnevű 36-magos CPU alapvető problémára talált megoldást."
Vagyis ez a proci kitalálta, hogy kellene őt optimálisan kihasználni.

(#2) Patice


Patice
nagyúr

A processzorok tényleg kezdik már megközelíteni a "dinnye" fogalmát. :))

Eladó: Apple iPad mini 1 (2db)

(#3) Lacielvtárs válasza Patice (#2) üzenetére


Lacielvtárs
nagyúr

+1 :))
bizony bizony :C

"Egy perc hosszúságát az határozza meg hogy a budi ajtó melyik oldalán állsz." ¯\_(ツ)_/¯

(#4) nakos1212 válasza Patice (#2) üzenetére


nakos1212
senior tag

nem dinnye, hanem kombájn.

(#5) AAAgold


AAAgold
senior tag

"Ráadásul a kutatócsoport később nyílt forrásúvá teszi a lapka leírását méghozzá Verilog nyelven."

ha Klingon nyelven tennék közzé, mégtöbb kocka rá tudna mozdulni :DD

"Miért imádják az aranyat? Nem lehet megenni..."

(#6) edari


edari
őstag

Ok, feldobtátok a reggelemet :D

(#7) nakos1212 válasza edari (#6) üzenetére


nakos1212
senior tag

ja tényleg!
pálinkás jóregge'

(#8) Teaway válasza AAAgold (#5) üzenetére


Teaway
veterán

Sokan beszél nem jól magyar, nemhogy Verilog-ul...

Nincs itthon csokid??

(#9) buherton


buherton
őstag

Nekem nem teljesen világos, hogy akkor most a programozónak kell megoldania a többszálúsítást, vagy a CPU megoldja maga?

tely, baly, fojó, mennyél, mingyárt, telyföl, tolyás, malyd, kapú, egyenlőre, ejsd, jáccani, ahoz, fúj, hüje, muszály, alat, álok, lasan, fojtatás, ál, fontós, költsön, eggyüt, lyob (jobb?), mek, mongyak, milyért - !!! Tanúlyunk már meghejjessen irni... !!!

(#10) nakos1212 válasza buherton (#9) üzenetére


nakos1212
senior tag

a cpu oldja meg.

(#11) Akula


Akula
őstag

Pofon egyszerű felfedezés, azt hittem, ez már régóta így van megoldva a többmagos procikban :U

"Akula Sub, ready for the deep!"

(#12) mallee válasza nakos1212 (#10) üzenetére


mallee
tag

Szerintem meg a programozó :DDD

(#13) nakos1212 válasza mallee (#12) üzenetére


nakos1212
senior tag

vesszünk össze.

(#14) Abu85 válasza buherton (#9) üzenetére


Abu85
HÁZIGAZDA

Természetesen a programozónak. Ez csak annyit tesz, hogy ha jó kódot írtál, akkor valóban skálázódik.
Ma még fontos a programozónak észben tartania, hogy a kommunikáció kisajátítja a buszt, így egylapkás 10+ magos procinál nem az az ideális, ha mindegyik magot munkára fogja, hanem az, amikor még a kommunikáció nem akadályozza a munkavégzést. Teszem azt van egy Xeon Phi procid, akkor könnyen lehet, hogy a program 20 magig gyorsul utána pedig lassul, tehát az optimális kihasználás az 20 mag, mert itt a leggyorsabb az amúgy 60 maggal rendelkező proci.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#15) Sanya válasza buherton (#9) üzenetére


Sanya
nagyúr

venni kell egy jobb Icarus buszt.

A bortól bolondokat gondol az ember, DE A PÁLINKÁTÓL MEG IS CSINÁLJA!!!

(#16) nakos1212


nakos1212
senior tag

ha összetörjük, akkor lesz nagy magömlés!!!444

(#17) Reggie0


Reggie0
félisten

Kivancsi vagyok mekkora FPGA-ba fer bele.

(#18) MarQs


MarQs
senior tag

Tök jó cikk, érdekes fejlemény!
Jó lenne, ha idővel meg is valósulna, kell a fejlődéshez...

[ Szerkesztve ]

"Vagy fejlődsz, vagy hanyatlasz, nincs stagnálás!"

(#19) #97716736 válasza Patice (#2) üzenetére


#97716736
törölt tag

Ahogy mondja kolléga ;]

(#20) tothl


tothl
addikt

Alig várom, hogy a fejlesztés átszivárogjon a mobilpiacra.. :D

(#21) Duree


Duree
veterán

És erre az Intel vagy az AMD miért nem jött rá?

duree54

(#22) Abu85 válasza Duree (#21) üzenetére


Abu85
HÁZIGAZDA

Rájöttek már. Az ARM például figyel rá. Látható, hogy ők a Cortex-A57-et úgy tervezték, hogy négy cluster és ezekben négy-négy mag. Tehát a fő busz mögött van négy cluster busz, amin van a négy-négy mag. Ezzel a buszok terhelése megoszlik. Ha megnézed az AMD-nél a Jaguart, akkor az is clusteres rendszer, vagyis egy cluster buszra maximum négy mag köthető és úgy köthetők a clusterek a fő buszra. Intel Silvermont dettó, csak ott a clustert modulnak hívják és az két magból áll.
A megoldás pedig komplexebb, mint ahogy leírják. Részben biztos befolyásolja az ISA memóriamodellje, és hát sem az ARM, sem az x86 nem módosítható, mert akkor nem tudja majd futtatni a régi progikat. A Scorpio esetében az ötlet és a működés fantasztikus, de ezt egyedi ISA-val érték el.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#23) AAAgold válasza Abu85 (#22) üzenetére


AAAgold
senior tag

"sem az ARM, sem az x86 nem módosítható, mert akkor nem tudja majd futtatni a régi progikat."

és ha már ennyi mag meg teljesítmény van, akkor néhány magot nem lehet befogni egy virtulizációra, hogy a régi progik is működő képesek legyenek?

"Miért imádják az aranyat? Nem lehet megenni..."

(#24) Abu85 válasza AAAgold (#23) üzenetére


Abu85
HÁZIGAZDA

Erre nem tudok válaszolni. Inkább azt látjuk, hogy a magokkal elmegyünk, ameddig lehet, a lapka többi részére meg mehet az IGP, amit lehet használni általános számításra is. Ez a modell most az iránymutató mindenkinél. Nem hiszem, hogy mindenki tévedne ebben a kérdésben, de persze lehet. :DDD

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#25) AAAgold válasza Abu85 (#24) üzenetére


AAAgold
senior tag

én az új architektúra és a korábbi kódok futtatására értettem - hogy az új leváltja a régi akadályozó dolgokat, de a kompatibilitás miatt virtualizációt használnak rajta

"Miért imádják az aranyat? Nem lehet megenni..."

(#26) Duree válasza Abu85 (#22) üzenetére


Duree
veterán

Köszönöm az infót,most ,ár értem a dolgot

duree54

(#27) ukornel


ukornel
aktív tag

A cikkben emllített probléma hogyan jelentkezik GPU-n?
A GPU "magok" között milyen összeköttetés van (pl. GCN architektúra), és a skálázódás problémáját hogyan oldják meg? Hasonlóan a cikkben leírtakhoz, vagy teljesen más a megközelítés?
(Lehet, hogy láma a kérdés, bocs)

[ Szerkesztve ]

(#28) Abu85 válasza ukornel (#27) üzenetére


Abu85
HÁZIGAZDA

Mivel a GPU-k nem CPU-k, így olyan skálázási modellt használnak, amely sok tízezer szálat is tökéletesen kezel. Ez bele van építve az ISA-ba. Ezért tudnak skálázódni.

A CPU-kkal az a gond igazából, hogy a késleltetésre vannak optimalizálva, tehát igazából nem tudják elfedni semmivel a különböző adatelérésből és kommunikációból eredő késleltetést, így szimplán üres ciklusokat futnak, ha várniuk kell az adatra. A GPU-kban rengeteg szál áll sorban, hogy futhasson, amíg az egyik szál adatra vár, ezzel nincs kiesés a rendszerben.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#29) ukornel válasza Abu85 (#28) üzenetére


ukornel
aktív tag

Aha, értem, köszi.
A cikkben írtad is, hogy a Scorpio-nál speciálisan rugalmas ISA-t használtak a jó skálázódáshoz. Tehát ez lehet az egyik kulcsa a dolognak.

(#30) Abu85 válasza ukornel (#29) üzenetére


Abu85
HÁZIGAZDA

Igen, biztos közre játszik ez is, de eddig senki sem csinált ilyet késleltetésre optimalizált magokkal. Szóval ez így is áttörés, függetlenül attól, hogy nem biztos, hogy a mai ISA-kra ráültethető.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

(#31) namaste


namaste
tag

A Scorpio processzor egyébként saját fejlesztésű utasításarchitektúrát használ

Freescale e200 32 bites Power magokat használ, részletek.

Copyright © 2000-2024 PROHARDVER Informatikai Kft.