Keresés

Új hozzászólás Aktív témák

  • Egon

    nagyúr

    válasz Petykemano #30780 üzenetére

    Reprezentatív statisztika a mintavétel jellegétől függően a gyakorlatban általában azt jelenti, hogy valamilyen változó mentén reprezentatív az adott statisztika. Pl. ha a magyar választásokról szeretne valaki reprezentatív statisztikát készíteni, akkor ha mondjuk tudott, hogy a választójoggal rendelkezők 15 %-a húszas éveiben járó férfi, akkor - ezer fős minta esetében - pontosan 150, 20-29 év közötti életkorú férfit kell megkérdezni ahhoz, hogy életkor és nem szerint reprezentatív legyen a statisztika (értelemszerűen a többi 850 megkérdezettnek is tükröznie kell az országos arányokat ilyen szempontból). Ahhoz, hogy megfelelő változók vonatkozásában legyen reprezentatív a statisztika, azon eloszlást kell figyelembe venni a minta kiválasztásakor, amely a végeredmény szempontjából releváns lehet. A fenti példából kiindulva: ha befolyásolhatja a pártszimpátiát az életkor, a nem, a lakhely, az iskolai végzettség stb., akkor ezen változók tekintetében kell reprezentatívnak (tehát a sokaságot reprezentálónak, azaz azonos arányúnak) lennie a mintának - ellenben pl. ha a szemszínnel kapcsolatban nem sikerül kimutatni semmilyen olyan eltérést, hogy pl. a kékszeműek nagyobb arányban szavaznának egy adott pártra, mint a barna szeműek, akkor ilyen szempontból nem kell reprezentatívnak lennie a statisztikának, tehát akár csak kizárólag barna szeműeket megkérdezve is a kellő szempontokból reprezentatív lesz a felmérés. Más szempontok alapján lehet, hogy abszolút nem lesz reprezentatív a statisztika, pl. akár véletlenül is előfordulhat olyan, hogy csak gmail-es e-mail címet használó egyedek kerülnek kiválasztásra, de mivel nehéz elképzelni, hogy ennek bármilyen torzító hatása is lenne a pártreferencia országos leképzésére, így ez teljesen indifferens.
    Amennyiben nem ilyen célzott mintavétel történik, akkor mindössze annyi az elvi követelmény egy minta reprezentativitását illetően, hogy teljesen véletlenszerűen kerüljenek az egyes elemek kiválasztásra, oly módon, hogy a sokaság minden elemének egyforma esélye legyen a mintába kerülésre.
    A Steam statisztika a teljes vga-piac szempontjából valószínűleg nem reprezentatív, hiszen pl. az integrált gpu-k relatív alacsony száma nyilvánvalóan azt tükrözi, hogy játékra inkább dedikált hardvert választanak a felhasználók. A Steam felhasználók vonatkozásában a statisztika reprezentatív lehet (szerintem jó eséllyel az). Ennek ellenkezője akkor lehetséges, ha egyrészt a 125 millió felhasználóból nem egyenlő eséllyel indulna mindenki, hogy bekerüljön a mintában szereplő cirka egymillió felhasználó közé, másrészt ha bebizonyosodna, hogy torzító hatása van annak, hogy ki járul hozzá a statisztikában történő szerepléshez és ki nem (nehezen tudom elképzelni, hogy pl. AMD-sek a tényleges Steam-es arányukhoz mérten nagyobb arányban utasítsák vissza a statisztikában szereplést, mint mondjuk az nV-sek), harmadrészt ha az olyan mérési pontatlansáágok, mint amit Abu említett (ti. hogy nem a megfelelő hardvert detektálja a rendszer) nagymértékben torzítanák a képet (véleményem szerint igen kevés hasonló eset fordulhat elő, úgyhogy ezt kizárnám).

  • Abu85

    HÁZIGAZDA

    válasz Petykemano #30780 üzenetére

    Mert alapvetően rossz az a mintavételi forma, hogy bárki kitöltheti aki akarja, illetve az sem célravezető, hogy négy survey lesz összevegyítve, ahogy az is rengeteg hibát generál, hogy nem mindenkinél jelenik meg a kitöltés lehetősége.

    Itt nincs semmiféle csalásról szó. Egyszerűen a mintavétel formája minden statisztikára vonatkozó szabályt felrúg. Ezt a Valve úgy kezeli, hogy nem reprezentatív statisztikának tekinti.

    Ez akkor lenne működő formula, ha a userek gépét a steam minden bejelentkezésnél ellenőrizné és elküldené az anonim statisztikába. Ezzel biztosítható lenne, hogy aki bejelentkezik az részt vesz benne, illetve egy user csak egy gépadatot küld, ráadásul folyamatosan frissülőt. Ugyanakkor ez még anonim formában sem számít sok országban törvényesnek, ha nem fogadja el a felhasználó, mint használati feltételt, tehát ezzel a Valve nem tud kezdeni semmit. Illetve az egész nem ér annyit, hogy ezzel foglalkozzanak, mert nekik pénz ebből nem származik. A stúdiók és kiadók úgyis külön megbíznak cégeket, hogy mérjék fel nekik a piacot.
    Arról nem is beszélve, hogy ha a Valve ezt csinálná, akkor abból mekkora műbalhét kreálnának a userek, hogy mi köze van az adataimhoz, stb. Szóval önmagában egy kötelező adatküldést bevezetni egy komoly presztízsveszteség lenne a Valve számára.

    Ez nem a felülreprezentálásról szól. Az Intel például borzalmasan alul van reprezentálva, holott a GPU-piac 70+ százaléka az övék.

Új hozzászólás Aktív témák

Hirdetés