Keresés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz S_x96x_S #9133 üzenetére

    Vegyünk egy mély levegőt...

    Na nézzük, tehát egyszer látunk egy 3200-as GB6 eredményt.
    Ezt a chip 4.3Ghz csúcs-frekvenciával hozza.

    Az Oryon a 2023-as bejelentés ellenére tudtommal egy 2024-es termék, tehát megvásárolni majd csak 2024-ben lehet termék formájában.

    Itt írnak a Samsung Galaxy S24-ről, amiben az új (már beépíthető) Qualcomm SD 8 Gen 3-ról, ami már az új Arm Cortex X4-et használja. [link] Egyébként elvileg az is 2024-es termék. Ez lehet, hogy csupán egy backup a Qualcomm részéről, de a két külön termék jelezheti azt is, hogy az Oryon valamilyen oknál fogva, legalábbis az itt bemutatott formájában egyelőre nem célozza a mobil piacot.

    Szóval az Arm Cortex X4 elér GB6-ban mintegy 2200 pontot. Ehhez képest tehát az Oryon 45%-kal gyorsabb. Ehhez a 2200 ponthoz elvileg 3.3-3.4Ghz társul.
    Az Oryon 4.3Ghz-en megy. A nagyobb teljesítményből máris 26%-ot magyaráz a frekvencia. Ami azt jelenti, hogy az X4-hez képesti többletteljesítményből mindössze 15% köszönhető az új architektúrának.

    Noha lehet azt mondani, hogy a 15% nem annyira sok, az persze igaz, hogy aki a Cortex X4 és az Oryon között vacilál az nem ezt a 15%-ot látja, hiszen a designnak része a magasabb frekvencia elérésére való képesség. Ennek persze valószínűleg lehet ára a lapka méretében (ahogy ugye az AMD és az Intel is tranzisztorszámban és lapkaméretben fizet a 6Ghz-ért) Ez lehet magyarázata annak, hogy miért a notebook a célpiac.

    Ezzel együtt az energiahatékonyság figyelemre méltó.

    Itt az Intel chippel való összevetést talán csak annyira érdemes megemlíteni, hogy talán nem véletlen, hogy azzal történt az összehasonlítást. De végülis nem is tudom, hogy a Phoenix hivatalosan elrajtolt-e, bekerült-e valamilyen notebookba, vagy mindent elvittek a kézikonzolos gyártók. Na mindegy. Szóval a raptor lake mobile nem egy kifejezetten energiahatékony termék. Etekintetben sokkal versenyképesebb alternatíva lesz a Meteor lake. Elvileg. 2024-ben. Bár az 50%-kal jobb energiahatékonyság még mindig csak kozmetikázza a 70%-os lemaradást.

    Az Apple-lel való összevetés is elég jól mutat. 15%-kal jobb teljesítmény VAGY 30%-kal energiahatékonyabb működés. Tudtommal az M2 is N4-en készült már és az M3 ugyan N3-on készül, de elég kevés fókuszt kapott a CPU és az energiahatékonyság sem javult lényegesen. A Oryon előnye talán csak az Apple bealvásának köszönhető. (Vagy ha másképp fogalmazunk, akkor annak, hogy átmentek oda az Apple mérnökök)

    Én úgy látom, hogy nagyon nagy verés most sem fog történni. 10-20%-os teljesítmény és/vagy energiahatékonyságbeli különbségek lehetnek majd. Amire majd mondhatjuk, hogy a verseny jó. Legkevésbé sem hegyezném ki a kérdést az ISA-ra. Ha az x86 hátrányt is jelent valamiben, nem gondolom, hogy akár az AMD, akár az Intel ne tudna ARM alapú processzorok tervezésére átevezni. Az x86 processzorok élveztek eddig és talán élvezhetnek még a jövőben valameddig némi helyzeti előnyt a szoftveres ökoszisztéma miatt, de ennek valószínűleg előbb utóbb vége szakad.

    Ami számomra izgalmasabb kérdés, hogy vajon milyen lehet az Oryon magok felépítése. (És hogy vajon a bizonyos értelemben elszigetelt versenytárs Apple helyett ennyire közvetlen versenytárs érkezése rákényszeríti-e az AMD és/vagy az Intelt a magas frekvencia helyett a sűrűbb, és szélesebb design felé fordulásra)

    Az egyik slide-on 42MB cache szerepel 12 maghoz.
    Úgy vélem, hogy a Nuvia is eredetileg széles magban gondolkodhatott: alacsony frekvencia, sok cache.
    Többféle felépítést el lehet gondolni:
    1.)
    Az intel és AMD magokhoz hasonlóan nagy privát L2$ és egy megosztott L3$.
    Mivel eredetileg az Oryon magokat szerverbe szánták, és állítólag a szerver workload-ok szeretik a nagy privát L2-t és nem kifejezetten jól hasznosítják az L3$-t:
    - 24MB megosztott L3$-t,
    - 12x1MB privát L2$-t
    - és magonként 0.5MB L1$-t (valamilyen felosztásban a L1d és L1i között)

    2.)
    Ugyanez kicsit más felosztásban, még "szerveresebben"
    - 12MB megosztott L3$-t,
    - 12x2MB privát L2$-t
    - és magonként 0.5MB L1$-t (valamilyen felosztásban a L1d és L1i között)

    3)
    A blokk diagram persze inkább 3db 4 magos CPU klaszter felépítésre utal, és a blokk diagramon nem utal semmi arra, hogy azokat összekötné valamilyen koherens cache.
    - 3x12MB megosztott L2$
    - és magonként 0.5MB L1$-t (valamilyen felosztásban a L1d és L1i között)
    Ez inkább az Apple megközelítésére hasonlít. Nyilvánvalóan ugyanazokkal a hátrányokkal rendelkezne, mint egy Zen2, vagyis bármilyen koherenciát igénylő alkalmazás, ami az egy klaszterhez tartozó 4 magon túl terjeszkedne, kehegni fog.

Új hozzászólás Aktív témák

Hirdetés