Hirdetés

Új hozzászólás Aktív témák

  • Egon

    nagyúr

    válasz Petykemano #30780 üzenetére

    Reprezentatív statisztika a mintavétel jellegétől függően a gyakorlatban általában azt jelenti, hogy valamilyen változó mentén reprezentatív az adott statisztika. Pl. ha a magyar választásokról szeretne valaki reprezentatív statisztikát készíteni, akkor ha mondjuk tudott, hogy a választójoggal rendelkezők 15 %-a húszas éveiben járó férfi, akkor - ezer fős minta esetében - pontosan 150, 20-29 év közötti életkorú férfit kell megkérdezni ahhoz, hogy életkor és nem szerint reprezentatív legyen a statisztika (értelemszerűen a többi 850 megkérdezettnek is tükröznie kell az országos arányokat ilyen szempontból). Ahhoz, hogy megfelelő változók vonatkozásában legyen reprezentatív a statisztika, azon eloszlást kell figyelembe venni a minta kiválasztásakor, amely a végeredmény szempontjából releváns lehet. A fenti példából kiindulva: ha befolyásolhatja a pártszimpátiát az életkor, a nem, a lakhely, az iskolai végzettség stb., akkor ezen változók tekintetében kell reprezentatívnak (tehát a sokaságot reprezentálónak, azaz azonos arányúnak) lennie a mintának - ellenben pl. ha a szemszínnel kapcsolatban nem sikerül kimutatni semmilyen olyan eltérést, hogy pl. a kékszeműek nagyobb arányban szavaznának egy adott pártra, mint a barna szeműek, akkor ilyen szempontból nem kell reprezentatívnak lennie a statisztikának, tehát akár csak kizárólag barna szeműeket megkérdezve is a kellő szempontokból reprezentatív lesz a felmérés. Más szempontok alapján lehet, hogy abszolút nem lesz reprezentatív a statisztika, pl. akár véletlenül is előfordulhat olyan, hogy csak gmail-es e-mail címet használó egyedek kerülnek kiválasztásra, de mivel nehéz elképzelni, hogy ennek bármilyen torzító hatása is lenne a pártreferencia országos leképzésére, így ez teljesen indifferens.
    Amennyiben nem ilyen célzott mintavétel történik, akkor mindössze annyi az elvi követelmény egy minta reprezentativitását illetően, hogy teljesen véletlenszerűen kerüljenek az egyes elemek kiválasztásra, oly módon, hogy a sokaság minden elemének egyforma esélye legyen a mintába kerülésre.
    A Steam statisztika a teljes vga-piac szempontjából valószínűleg nem reprezentatív, hiszen pl. az integrált gpu-k relatív alacsony száma nyilvánvalóan azt tükrözi, hogy játékra inkább dedikált hardvert választanak a felhasználók. A Steam felhasználók vonatkozásában a statisztika reprezentatív lehet (szerintem jó eséllyel az). Ennek ellenkezője akkor lehetséges, ha egyrészt a 125 millió felhasználóból nem egyenlő eséllyel indulna mindenki, hogy bekerüljön a mintában szereplő cirka egymillió felhasználó közé, másrészt ha bebizonyosodna, hogy torzító hatása van annak, hogy ki járul hozzá a statisztikában történő szerepléshez és ki nem (nehezen tudom elképzelni, hogy pl. AMD-sek a tényleges Steam-es arányukhoz mérten nagyobb arányban utasítsák vissza a statisztikában szereplést, mint mondjuk az nV-sek), harmadrészt ha az olyan mérési pontatlansáágok, mint amit Abu említett (ti. hogy nem a megfelelő hardvert detektálja a rendszer) nagymértékben torzítanák a képet (véleményem szerint igen kevés hasonló eset fordulhat elő, úgyhogy ezt kizárnám).

Új hozzászólás Aktív témák