Megreformálja az otthoni AI-t a Framework Desktop

Hirdetés

Legfrissebb anyagok

LOGOUT témák

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD témák

Új hozzászólás Aktív témák

#44 rxmiss aktív tag Raymond #43

Új Válasz 2025-09-05 03:33:07 #44
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

rxmiss

aktív tag

válasz Raymond #43 üzenetére

koszi, kiprobalom oket
#43 Raymond titán rxmiss #42

Új Válasz 2025-09-04 19:12:01 #43
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz rxmiss #42 üzenetére

De igen, van par, peldaul Qwen3 30B A3B es Qwen3 Coder 30B A3B (3B aktiv parameter) vagy a gpt-oss 20B (3.6B aktiv parameter) es gpt-oss 120B (5.1B aktiv parameter). Ezek normalis sebessegel mennek CPU-val is a RAM-bol. Az a Qwen3 Q6-ben peldaul tud olyan 15-20 tok/s sebesseget egy DDR5 rendszeren, attol fuggoen hogy milyen a RAM (4800-5600-6400) es quant. Q4 valamivel jobb. RAM igenyek se brutalisak igazan, a Qwen3 26GB Q6-al es olyan 18GB Q4-el, a gpt-oss 20B pedig csak 12GB alapbol a 120B pedig 65GB (MX4FP formatum). Tehat ha van 96GB vagy tobb RAM-od (es turelmed) akkor meg a gpt-oss 120B hasznalhatonak nevezheto. A prompt processing persze CPU-val aranylag lassu ami akkor problema ha mar hosszabb a cseveges vagy eleve hosszu az elso prompt. Ha sikerul mondjuk 200-300 tok/s sebesseget ott elerni egy 8000 tokenes promptnal mar eleve fel percet is varsz mire egyaltalan elkezdi a generalast.
#42 rxmiss aktív tag Raymond #41

Új Válasz 2025-09-04 18:01:40 #42
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

rxmiss

aktív tag

válasz Raymond #41 üzenetére

egyebkent meg mindig nincs olyan modell, ami ertelmes sebesseggel fut 'cpu only'? lm studioval szoktam jatszani az otthoni epyc 7713-on 512G ram-mal (8 csatorna), de nem egy villam. (a videokartya egy rx6800, meg epp nem tamogatja a ROCm, sem docogosen, sem docogostelenul ) szoval altalaban a vulkan-t hasznalom.
#41 Raymond titán Kristof93 #37

Új Válasz 2025-03-08 12:16:57 #41
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz Kristof93 #37 üzenetére

Nocsak, ezt nem is lattam...
Nem en vagyok eltevedve hanem te. A kontextus is jo lett volna ha megnezed. Itt arrol volt szo hogy egy rakat 256GB/s savszelt tudo 128GB-os gepet osszekotni hogy a nagy modellek menjenek. Ennek nincs ertelme az eszmeletlen ara miatt. Produktiv kornyezetben ezt nem csinalod mert a teljesitmeny csapnivalo, ezt max jatszadozasra es kiprobalasra jo (a kollega pl. a full Deepseek R1-et celozzta meg), oda meg nem fogsz 12-14K USD/EUR-t beleolni mert ugyanazt megkapod ennek az arnak a toredekeert. A Strix Halo-nal lathato 256bit DDR5-8000 alltal adott 256GB/s megvan a 8-12 csatornas szever platformoknal is ahol egy darab gepbe belerakod a szukseges 512-768GB RAM-t es a komplett ar a toredeke lesz a 6x Framework gepek aranak. Ha jobban megerolteted magad es turelmes vagy akkor 1-2 darab Framework gep araert megvan a 12 csatornas gep 768GB RAM-al.
#40 moleculez veterán

Új Válasz 2025-02-27 10:15:37 #40
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

moleculez

veterán

Dedikált AI hardvernek eddig az NVidia Project Digits látszik a legéletképesebbnek (papíron), kiváncsian várom mi sül ki belőle.
#39 Kristof93 senior tag S_x96x_S #38

Új Válasz 2025-02-26 18:58:37 #39
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Kristof93

senior tag

válasz S_x96x_S #38 üzenetére

Azokon is van 128gb HBM vagy forrasztott lpddr5. De teljesen más kategória, nem otthoni szerver amit 4db strix halo árából raksz össze, ami a hasonlítási alap volt itt.
#38 S_x96x_S addikt Kristof93 #37

Új Válasz 2025-02-26 18:41:45 #38
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Kristof93 #37 üzenetére

a vram tényleg fontos ( mind a mennyiség / sávszélesség / és az ár is )
> Olyan szerver cpu amiben van egy gyors igpu pedig nem létezik.
~ attól függ, hogy mit nevezünk igpu-nak;
vagyis nem árt a pontosítás - mert mindenki mást ért alatta;
( AMD Instinct™ MI300A ; NVIDIA GH200 Grace Hopper Superchip; .... )
Amúgy az AI gyorsítók fogalma elég tág;
az Intelnek is van - AMX ( CPU-s ) esettanulmánya - amikor az A100 -nál jobb.
"Performance: 17x Faster Than NVIDIA* A100 Tensor Core GPUs"
és ott van még a régi "Xeon Phi" próbálkozás is.
Amúgy ha nincs más - egy 12-csatornás Epyc -el 400 - 460.8 GB/sec - et ki lehet hozni.
#37 Kristof93 senior tag Raymond #35

Új Válasz 2025-02-26 18:20:08 #37
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Kristof93

senior tag

válasz Raymond #35 üzenetére

Teljesen el vagy tájolódva. A szerverbe annyi ramot pakolhatsz, amennyit csak szeretnél, abból úgy sem lesz vram. Ha a dedikált gpu azt kell használja akkor a sebesség és késleltetés a pcie-n keresztül ellehetetleníti az egészet. Nem szórakozásból pakolnak egyre több memóriát minden ai gyorsítóra és egyébb gpu-ra. Olyan szerver cpu amiben van egy gyors igpu pedig nem létezik.
#36 S_x96x_S addikt Raymond #35

Új Válasz 2025-02-26 18:03:27 #36
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Raymond #35 üzenetére

túlragoztuk,
Én elfogultan hiszek a sok VRAM -ban
és nem lehet egyszerűen meggyőzni, hogy a 64GB jobb mint a 128GB
#35 Raymond titán S_x96x_S #34

Új Válasz 2025-02-26 17:23:04 #35
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz S_x96x_S #34 üzenetére

Csak hogy vilagos legyen pedig mar irtam regebben. Fantasztikus hogy tudsz giglizni es hasznalni az internetet, de sokat segitene ha ertened is amit olvasol es megertened az osszefuggeseket. Ez a resz egyelore nagyon nagyon hianyos. Case in point:
"Az én FANTÁZIÁMBAN a lokális Deepseek R1 futtatása a cél.
Ami egy MoE - és nem árt hozzá több 128GB-os Strix Halo"
Ezt igy bughatod, mivel tobbe kerul es tobb a limitacio (clusteringnek hala) mint egy magasabb sebesseget elero sima 2U szerver lenne telepakolva RAM-al.
#34 S_x96x_S addikt Raymond #31

Új Válasz 2025-02-26 14:56:37 #34
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Raymond #31 üzenetére

> O RLY?
( ahelyett hogy kérdeznél,
túl sok előfelvetésed van, amelyeket nem validálász.
a félreértések oka leggyakrabban ez. )
Ezt te irtad: #28
"Hiaba latsz benne fantaziat ha nincs olyan MoE ami belefer a 128 vagy a 192GB-ba a most mar lassan matuzsalemnek nevezheto Mixtral-on kivul. Az hogy inference kozben kevesebb az aktiv az a memoriameret igenyeknel lenyegtelen mert a komplett cuccot be kell olvasnod."
Az én FANTÁZIÁMBAN a lokális Deepseek R1 futtatása a cél.
Ami egy MoE - és nem árt hozzá több 128GB-os Strix Halo
> Foleg ugy hogy nem cluster-rol volt szo.
~ a fantáziámról volt szó ..
#33 Busterftw nagyúr hapakj #3

Új Válasz 2025-02-26 14:43:01 #33
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Busterftw

nagyúr

válasz hapakj #3 üzenetére

Leforditom magyarra mirol van szo.
Ez a cucc kb CES-en ket laptopban volt demozva, tehat itt is egy speci "laptop" kiszerelesrol van szo, csak asztali kontosben.
A Strix Halo oda van forrasztva ahogy a rendszer memoria is.
Erre gondolt a kolto, hogy ilyen formaban nem nagyon tudod beszerezni, mert soldered cucc. Ami pont a Frameworknel erdekes, mert ugye ott epp a modularitason es a javithatosagon van a hangsuly.
A Framework csavo azt mondta, hogy megkerdeztek az AMD-t a cserelheto RAM-rol, de azt mondtak nem lehetseges...
Erdemes megnezni Linusek videojat, ott van a Framework faszi, elmondanak es mutatnak egy csomo uj cuccot.
#32 Mp3Pintyo senior tag

Új Válasz 2025-02-26 14:42:52 #32
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Mp3Pintyo

senior tag

Redditen olvastam elemzéseket ami alapján a várható sebessége egy nagyobb modell esetén 2 token/sec lesz.
De ha mondjuk ezt feltornászod spekulativ dekódolással akkor is csak 4-5 token/sec-et lehet összehozni.
Ez iszonyú messze van a valós időtől. Leginkább hajtépően lassú.
Azért ne hasonlítsuk már egy Mac Studiohoz. Ez kicsit több mindenre jó, ráadásul egy baromi jól kiépített ökoszisztémát kapsz.
Saját gépen nekem a 32B modell nvidia 3090-es kártyával hozza a 48 token/sec-es sebességet. Tény, hogy nem fér bele nagyobb modell de óriási a különbség a 4 és a 48 között.
#31 Raymond titán S_x96x_S #30

Új Válasz 2025-02-26 14:38:34 #31
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz S_x96x_S #30 üzenetére

O RLY?
1. nem errol beszeltel hanem a 128GB-rol, tehat egy gep, foleg abban a kontextusban
2. ha mar ott tartasz hogy 6+ darab kell akkor ez eleve nem opcio mert 12K nyugati penzert inkabb egy 2U server egy 8 vagy 12 csatornas vezerlovel es 1TB+ RAM-al
Szerk: egyebkent nem azt mondtam hogy *csak* a 64GB-nak van ertelme, olvasd el meg egyszer mit irtam ott. Foleg ugy hogy nem cluster-rol volt szo.
#30 S_x96x_S addikt Raymond #28

Új Válasz 2025-02-26 14:31:44 #30
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Raymond #28 üzenetére

> Az hogy inference kozben kevesebb az aktiv
> az a memoriameret igenyeknel lenyegtelen mert a komplett cuccot be kell olvasnod.
A clustert erre találták ki. (+ exo, zml és társai )
És az nvidia Digits -nek is hasonló memória sávszélje lesz 128GB -al. ( ~ 260 Gb/s ; legalábbis meglepő lenne ha többet tudna )
és amit szintén lehet clusterezni:
"High performance networking enables connecting two Project DIGITS systems together to work with AI models up to 405 billion parameters."
Persze a Digits -ről csak márciusban lesz pontosabb infó.
Ami te mondasz hogy csak a 64 GB-nak van értelme
az főleg a Laptopokra lehet igaz - mert azokat nem szokták clusterezni
( persze kivétel mindig van )
a Strix Halo - a 16 full Zen5-ös AVX-512 -CPU -val tudományos számításokra is
jó, De még játszani is lehet vele ..
Vagyis egy mindenre is jó univerzális workstation lehet.
-----------
Vagyis a 128GB Mem előnye, hogy könnyebb skálázni.
https://frame.work/hu/en/desktop?tab=machine-learning
""
NEED A CLUSTER? 
Framework Desktop has 5Gbit Ethernet along with two USB4 ports, allowing networking multiple together to run even larger models with llama.cpp RPC. With a Mini-ITX form factor, you can also pick up the Mainboard on its own and build it into your own mini-racks or standard rackmount server cases for high density.
""

És ha valakinek csak az alapok kellenek - akkor
6-8 db - "Ryzen™ AI Max+ 395 - 128GB" alaplap
6-8 x 829,990 Ft
összekötve már elég nagy modelleket is tud futtatni.
#29 S_x96x_S addikt Raymond #25

Új Válasz 2025-02-26 14:12:32 #29
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Raymond #25 üzenetére

> A RAM 75%-at tudja, tehat a 128GB modellnel 96GB.
> A 32GB-osnal pedig 24GB, ezt latni lehetett az Asus Flow teszteknel.
remény van - hogy ez egy sw -res limit és nem hw-res :
- "96GB on windows, 112GB on Linux" ( via Reddit - random 80 upvotos válasz )
#28 Raymond titán S_x96x_S #27

Új Válasz 2025-02-26 14:09:47 #28
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz S_x96x_S #27 üzenetére

Hiaba latsz benne fantaziat ha nincs olyan MoE ami belefer a 128 vagy a 192GB-ba a most mar lassan matuzsalemnek nevezheto Mixtral-on kivul. Az hogy inference kozben kevesebb az aktiv az a memoriameret igenyeknel lenyegtelen mert a komplett cuccot be kell olvasnod.
#27 S_x96x_S addikt Raymond #16

Új Válasz 2025-02-26 13:58:06 #27
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Raymond #16 üzenetére

> 64GB-nal van ertelme mert a nagyobb modelleknel ahol
> a 128GB RAM (96GB VRAM) kene ott nem kapsz
> normalis sebesseget a limitalt savszel miatt.
a Mixture of Experts (MoE) vagy (MoTE) modelleknél
( mint amilyen DeepSeek R1 , GPT-4, Mistral ...)
sokkal kevesebb paraméter aktiv; vagyis a sávszél kevésbé gond.
vagyis én a nagyobb VRAM -ban több fantáziát látok. ( Go 128GB , 196 GB ... )
#26 Xpod addikt Cythyel #7

Új Válasz 2025-02-26 13:55:22 #26
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Xpod

addikt

válasz Cythyel #7 üzenetére

Cythyel, Abu85: köszi, így már értem.
#25 Raymond titán S_x96x_S #24

Új Válasz 2025-02-26 13:45:47 #25
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz S_x96x_S #24 üzenetére

A RAM 75%-at tudja, tehat a 128GB modellnel 96GB. A 32GB-osnal pedig 24GB, ezt latni lehetett az Asus Flow teszteknel.
#24 S_x96x_S addikt Kristof93 #22

Új Válasz 2025-02-26 13:42:15 #24
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Kristof93 #22 üzenetére

> A legnagyobb quadro is csak 48gb
Az nvidiánál még alternativa lehet ( a Digits megjelenéséig )
a robotikára kifejlesztett
"NVIDIA Jetson AGX Orin modul, 64 GB" ~ EUR 2 676,00 (Áfával együtt)
- 64GB 256-bit LPDDR5 ~ 204.8GB/s
- 12-core Arm® Cortex®-A78AE v8.2 64-bit CPU
- 2048-core NVIDIA Ampere architecture GPU with 64 Tensor Cores
> a strix halo, elég meglepő.
> Egy erős, desktop szintű igp, de hozzáfér akár 128gb memóriához.
mindenfélét irtnak - úgyhogy nemárt pontosan utánanézni.
- valahol - hogy csak 96GB címezhető az RDNA 3.5 -el a 128GB -ból
- valahol - meg azt, hogy ennél több is lehet ..
Talán a 96GB a hivatalos.
#23 S_x96x_S addikt

Új Válasz 2025-02-26 13:33:35 #23
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

És ez az a Proci - amit Januárban - az AMD úgy reklámozott,
hogy lenyomja az RTX 4090 ( 24GB ) -ot
*** minden olyan dologban - amire 24GB nem elég ***
( minden más dologban meg nem )

az Nvidia Digits ( ami arm-os ) akkor lehet jó,
ha valakinek fontos a CUDA és az nvidia szoftveres ökoszisztéma .
#22 Kristof93 senior tag

Új Válasz 2025-02-26 13:32:27 #22
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Kristof93

senior tag

Azért a prohardveren nem érteni, hogy miért új termék kategória a strix halo, elég meglepő. Egy erős, desktop szintű igp, de hozzáfér akár 128gb memóriához. A legnagyobb quadro is csak 48gb, és az többe kerül mint több ilyen számítógép. Ilyent eddig csak az Apple tudott.
#21 S_x96x_S addikt zhit86 #17

Új Válasz 2025-02-26 13:25:41 #21
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz zhit86 #17 üzenetére

> Lehet már a Framework cuccokat kapni itthon vagy legalább EU-ból rendelve?
pár hónapja már lehet Magyarországra is rendelni.
és azóta Ft -ban vannak az árak ( + magyar áfa )
A Laptopokban is sok fantázia van - főleg akkor, hogyha a szerelhetőséget többre becsülöd.
És már látom a Strix Point -os Ryzen AI 300 -as Framework-13 előrendelését is.
( amibe 96 GB DDR5 RAM -ot lehet tenni, de később várható a 128GB SO-DIMM -is )
vagyis akinek sok RAM / SSD -kell, az jobban jár, hogyha itthon veszi meg
és ha maga szereli be.
https://frame.work/hu/en/products/laptop13-diy-amd-ai300/configuration/new
( itt még nem hozza fel a magyar billentyűt az előrendelésnél - de van olyan is nekik )
#20 Abu85 HÁZIGAZDA Xpod #6

Új Válasz 2025-02-26 13:13:27 #20
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Xpod #6 üzenetére

De nem ekkora számítási teljesítménnyel.
NPU kerül több prociba, de az nem elég ilyen nagy LLM-ek futtatására.
#19 hokuszla senior tag

Új Válasz 2025-02-26 13:01:49 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

hokuszla

senior tag

de ha összekötünk öt darab Framework Desktopot az USB4 vagy az 5 gigabites Ethernet segítségével, akkor a DeepSeek R1 671B LLM otthoni futtatása sem akadály
*5
#18 Raymond titán zhit86 #17

Új Válasz 2025-02-26 12:38:52 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz zhit86 #17 üzenetére

Elorendelni lehet es egy azert aranylag savasnyu aprosag kimaradt meg:
a jelek szerint majd valamikor Q3-ban szallitjak
A nominalis savszel 256GB/s es benchmarkban amit valaki mert par napja olyan 220GB/s amit ki lehet belole hozni. Ez egyebkent nagyon jo efektivitas, sokkal jobb mint a sima DDR5 vagy DDR4 platformjaiknal.
#17 zhit86 csendes tag

Új Válasz 2025-02-26 12:35:32 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

zhit86

csendes tag

Ez fain kis cuccnak tűnik... Kicsit drága, de jobban tetszik, mint a kínai alternatívák.
Az összeszerelt gép is okosan kialakítottnak tűnik (hűtés), de ha lehet csak alaplapot (rajta proci, 64-128 GB memória) kapni az még több lehetőséget megnyit.
Lehet már a Framework cuccokat kapni itthon vagy legalább EU-ból rendelve?
A memória sávszélesség mennyire jön ki?
#16 Raymond titán

Új Válasz 2025-02-26 12:29:06 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

"A vállalat szerint a kedvelt Llama 3.3 70B Q6 LLM-mel valós időben lehet úgymond beszélgetést folytatni"
Sure Meg a Q4-el is csak olyan 5-6 tok/s a sebesseg ami minden csak nem folyamatos beszelgetes.
"Ez viszont a vállalat szerint még mindig sokkal olcsóbb a 4800 dollárért kérhető, 128 GB RAM-mal szerelt Apple Mac Studio konfigurációnál, ráadásul gyorsabb is nála."
Csak ott almat hasonlitanak a kortehez (har har) raadasul nem gyorsabb annal a $4800 konfiguracional termeszetesen mert az mar M2 Max/Ultra vagy M4 Max az ujabb termekeknel. Amihez hasonlitani lehet teljesitmenyben az az M4 Pro-val szerelt gepek ahol 276GB/s a memoria savszel (vs. az ennel levo 256GB/s) es azokkal durvan egy arkategoria. Shocker! Valamivel olcsobb mert hat Apple tax, ennek a 128GB konfig ara van ott ahol a Mac Mini M4 Pro 64GB van. Ebbol is inkabb a 64GB-nal van ertelme mert a nagyobb modelleknel ahol a 128GB RAM (96GB VRAM) kene ott nem kapsz normalis sebesseget a limitalt savszel miatt.
1279€ - Ryzen AI Max 385 (8C 8050S) 32GB
1895€ - Ryzen AI Max+ 395 (16C 8060S) 64GB
2329€ - Ryzen AI Max+ 395 (16C 8060S) 128GB
Az 1895 kimondottan jo ar erte, a 48GB VRAM eleg a 70/72B Q4-nek is (40-42GB) es a sebesseg is kezdi a turheto hatart elerni alulrol (5-6 tok/s) ami speculativ decoding mellet akar 8-10 tok/s-re is feltornazhatja magat.
Ha valakinek szukos lenne megis az a 64GB/48GB konfiguracio akkor ott a 128GB, de a felara eleg nagy. Persze meg mindig kisebb mint egy Apple cuccnal.
#15 Alaaf Pi őstag ViZion #12

Új Válasz 2025-02-26 11:48:09 #15
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Alaaf Pi

őstag

válasz ViZion #12 üzenetére

Még csak az se. És nem Applehez nézem.
#14 S_x96x_S addikt Cassi #9

Új Válasz 2025-02-26 11:47:51 #14
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

válasz Cassi #9 üzenetére

> Képzelem mekkora piaca lehet az otthoni használatra szánt DeepSeek-klasztereknek.
napról napra egy nagyobb.
ez hasonló - mintha egy kis cég
( ~ a saját dokumentumainak a feldolgozására )
saját DeepSeek -et szeretne futtatni
És a fejlesztőnek kell egy saját konfig - Home Office -ban.
amúgy https://www.reddit.com/r/LocalLLaMA/
#13 S_x96x_S addikt

Új Válasz 2025-02-26 11:44:06 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

S_x96x_S

addikt

Egy M2 Ultra - 800 BW [GB/s] memória sebességgel és 60-core os GPU -val
azért még jelentősen erősebb ( AI-ban ) mint a FrameWork desktop
A FrameWork desktop - előnye az Apple konfigokkal szemben:
- erős X86-64 CPU magok és AVX-512 támogatás
- Windows és Linux kompatibilitás
- a lehetőségekhez képest jobb bővítés. ( sok olcsó M.2 -es diszk. )
- és az M.2 Oculunk-en keresztül lehetővé teszi akármilyen külső GPU csatlakoztatását is. ( pl. egy RTX 5090 -es -t is )
És valószínüleg lesz más gyártónak is ( pl. HP )
Hátránya:
- az AMD ROCm - még döcögős egy kicsit - nem árt huppanókra számítani.
- az NPU linux alatt - még döcögösebbb (saját tapasztalat )
De van remény - hogy sokkal jobb lesz !
------------------
A 4800 USD - konfig tartalma: ( és hamarosan jöhet az M4/M5 -ös Ultra !! )
"Apple M2 Ultra with 24‑core CPU, 60‑core GPU, 32‑core Neural Engine
128GB unified memory
1TB SSD storage
Front: Two Thunderbolt 4 ports, one SDXC card slot
Back: Four Thunderbolt 4 ports, two USB-A ports, one HDMI port, one 10Gb Ethernet port, one 3.5 mm headphone jack"
és 192GB memóriával $5,599. 800 BW [GB/s] !
Performance of llama.cpp on Apple Silicon M-series:
https://github.com/ggml-org/llama.cpp/discussions/4167
------------------
Ha valakit komolyabban is érdekel az AI
- Prohardver: "Mesterséges intelligencia topik"
- https://www.reddit.com/r/LocalLLaMA/ ( helyi LLM-ek futtatása )
- https://www.reddit.com/r/ChatGPTCoding/ ( LLM programozásra )
-------------------
Ha valakinek még olcsóbb megoldás kell,
akkor lehet, hogy az EU -van is megjelenik egy kínai alternativa:
Orange Pi AI Studio Pro mini PC - Kínai GPU -val ( Ascend 310s )
[ 352 TOPS + 192GB LPDDR4X ]
"Orange Pi AI Studio Pro Mini PC target Nvidia Jetson Orin Nano with up to 352 TOPS"

----------
A jó hír - hogy lesz egy kis verseny !
#12 ViZion félisten Alaaf Pi #11

Új Válasz 2025-02-26 11:44:00 #12
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ViZion

félisten

LOGOUT blog

válasz Alaaf Pi #11 üzenetére

az ára...
#11 Alaaf Pi őstag

Új Válasz 2025-02-26 11:42:45 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Alaaf Pi

őstag

Ebben mi a robbantás?
#10 hapakj őstag Cythyel #7

Új Válasz 2025-02-26 11:25:28 #10
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

hapakj

őstag

válasz Cythyel #7 üzenetére

Hát itt a hivatalos oldalon [link] 50 TOPS-os NPU-ról írnak ami kevesebb mint hatoda az RTX 4090-nek. Még ha overall-t nézzük, akkor is 2.5-szer lassabb.
#9 Cassi őstag

Új Válasz 2025-02-26 11:15:09 #9
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cassi

őstag

Képzelem mekkora piaca lehet az otthoni használatra szánt DeepSeek-klasztereknek.
A bányászláznál azt hittem, elértük a mélypontot, de nem, lehet menni tovább is.
#8 dseres tag Cythyel #7

Új Válasz 2025-02-26 11:14:55 #8
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dseres

tag

válasz Cythyel #7 üzenetére

És tényleg. Megnéztem a gyártó honlapján. A memória mennyisége a processzor-választástól függ.
#7 Cythyel senior tag Xpod #6

Új Válasz 2025-02-26 11:11:47 #7
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cythyel

senior tag

válasz Xpod #6 üzenetére

az npu ami a ryzen ai max-ban van, olyan erős, vagy erősebb mint ami a 4090-ben van, ráadásul több memója lehet mint a kártyának... egy baj van csak, a memó itt forrasztott, próbálták volna camm modullal is, de a szignál integritás nem volt elegendő, így most csak forrasztva érhető el
#6 Xpod addikt Abu85 #2

Új Válasz 2025-02-26 10:57:47 #6
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Xpod

addikt

válasz Abu85 #2 üzenetére

"Nincs bennük elég erő hozzá."
Ezt nem vágom. 128GB RAM-ot ugyanúgy bele lehet pakolni egy másik alaplapba is.
Pár hónapja meg volt hír, hogy AI chip kerül minden prociba, mert az olyan nagyon kell mindenkinek, meg az MS Copilothoz is követelmény.
#5 scdlsc senior tag

Új Válasz 2025-02-26 10:47:10 #5
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

scdlsc

senior tag

Már látom ahogy ellepik a Hardveraprót is a használt Mac Studiók és a tulajdonosaik kettesével rendelik ezt a gépet.
#4 Abu85 HÁZIGAZDA hapakj #3

Új Válasz 2025-02-26 10:20:15 #4
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz hapakj #3 üzenetére

Nem. A Framework alaplapját igen, de az ugye ez a termék. Jelenleg sajnos ez az egyetlen alternatíva. De persze nem kizárt, hogy később lesz olyan gyártó még, amely hoz Ryzen AI Maxos alaplapot 128 GB RAM-mal. Úgy tudni, hogy az AMD nem tiltja.
#3 hapakj őstag Abu85 #2

Új Válasz 2025-02-26 10:19:14 #3
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

hapakj

őstag

válasz Abu85 #2 üzenetére

Miért? Ezeket az alkatrészeket nem lehet a DIY piacon beszerezni?
#2 Abu85 HÁZIGAZDA Xpod #1

Új Válasz 2025-02-26 10:17:55 #2
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Xpod #1 üzenetére

Ez is összerakott gép. Viszont normál gépekkel nem tudsz ilyen LLM-eket lokálisan futtatni. Nincs bennük elég erő hozzá.
#1 Xpod addikt

Új Válasz 2025-02-26 10:12:31 #1
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Xpod

addikt

És ez most miért jobb, mint egy összerakott gép? Nem látok benne semmi spéci cuccot. Egyedül a gépház ami nem szokványos ezekkel a betétekkel. (Nekem tetszik a ház.)