Hirdetés

Új hozzászólás Aktív témák

  • Baryka007

    addikt

    válasz 5leteseN #66814 üzenetére

    Ez azért van, mert egy három tényezős nem lineáris görbéből scalel a program !

    Ez most nagyon kínaiul hangzik, de elmondom mi a lényege, és miért scaleli a pontszámot ! (Amit most törölni fogok)

    Alapból volt egy hibátlan motorom... Ami azonos CPU magszámú CPU-knál totál releváns értéket dobott, és csak a memóriára reagált... CPU ból 2ghz -t elvettem és 2% ot droppolt a dram tempó... Tehát tényleg alig volt érzékeny a CPU ra...

    Viszont !
    A haverom 12400F el is elindította a progit 7000 re húzott ddr5 ramokkal (ami aidaban ~100gb/s)
    És 20gb/s el lassabb tempót mért mint én a 4200 cl16-16-16 os b-die setupommal... 12600K val...

    Ez azért történt, mert 32 szálon mért akkor a motor... És amíg nincs a CPU -nak 32 szálja addig CPU ra scalel a progi...

    Ezért ha azonos magszámú CPU -val mértél akkor tök releváns volt az eredmény... De amint eltérő magszámú CPU alatt futtatott ramokat akartál egymáshoz hasonlítani, brutál mód elcsúsztak az eredmények...

    És akkor itt ment az ötletelés, hogy adjak akkora BufferSize-ot a szálaknak, hogy ha 4 magon indítjuk akkor is lefossa a bokáját tőle a ram...
    Ezzel az volt a baj, hogy 16gb ramos gépeket úgy teli etette, hogy lapozófájlig telítette a ramokat... tehát nem kaptál jó eredményt...

    Aztán akkor visszaállítottam a buffer size-ot...

    Ezután azt találtam ki, hogy akkor 4 szálon futtassuk a progit, mert 4 szálas CPU-ja már mindenkinek van...

    Noh ezzel meg az volt a baj, hogy bazi kicsi eredményeket kaptunk mert a 64 bites adatbuszon kommunikáló dramot nem bírod 4 threaddel kifektetni... És azon felül, hogy 6-8gb/s tempót mértél, még akkora szórás is volt 2 mérés között, hogy használhatatlan lett...

    És akkor kitaláltam, hogy futtassunk egy nagyon erős 4 szálas terhelést, ami scalel-i (tehát felskáláz) az eredményt...

    Lefuttatja a benchet 1 szálon 2 szálon 4 szálon...
    Majd kiszámít egy nem lineáris görbét, és megsaccolja hogy 32 szálon ez mekkora tempó volna...

    Noh és most ezért kapsz totál fals eredményeket, mert itt tartok... És nem jól számolja a scalinget a függvény...

    Szóval most ezt is nyugdíjazni fogom... Van már ötletem, hogy merre menjek tovább... De nem tudom működni fog -e... Mindenesetre kell a sok tesztelő hozzá, hogy pacekra megtudjam csinálni...

    A cél hogy 0,5% alatt legyen két bench között a szórás !
    Valós DRAM teljesítményt mérjen, ne CPU-t vagy schedulert akármit ....

    És összehasonlítható legyen, egymástól nagyon eltérő rendszerekkel is ! :K

Új hozzászólás Aktív témák