Štandardná chyba je štandardná odchýlka výberového rozdelenia štatistiky. Tento termín sa môže používať aj pre odhad (dobrý odhad) tejto štandardnej odchýlky získanej zo vzorky celej skupiny.

Priemer určitej časti skupiny (nazývanej vzorka) je obvyklý spôsob odhadu priemeru pre celú skupinu. Meranie celej skupiny je často príliš náročné alebo stojí príliš veľa peňazí. Ak sa však zmeria iná vzorka, bude mať priemer, ktorý sa bude trochu líšiť od prvej vzorky. Štandardná chyba priemeru je spôsob, ako zistiť, ako blízko je priemer vzorky k priemeru celej skupiny. Je to spôsob, ako zistiť, nakoľko si môžete byť istí priemerom zo vzorky.

Definícia a význam

Štandardná chyba priemeru (angl. standard error, SE) je odhad toho, o koľko sa priemery získané z rôznych nezávislých vzoriek tej istej veľkosti spriemerujú okolo skutočného priemeru populácie. Vyjadruje typickú (očakávanú) odchýlku priemeru vzorky od skutočného populačného priemeru. Menšia hodnota SE znamená presnejší odhad populačného priemeru.

Výpočet

Ak je populačná štandardná odchýlka σ známa (zriedkavé v praxi), štandardná chyba priemeru sa počíta ako:

SE = σ / sqrt(n)

Kde n je veľkosť vzorky a sqrt(n) je druhá mocnina (koreň) z n.

Ak σ nie je známa (bežný prípad), nahradíme ho odhadom zo vzorky s (vzorková štandardná odchýlka):

SE ≈ s / sqrt(n)

Tento odhad sa potom používa pri tvorbe intervalov spoľahlivosti a pri testoch hypotéz. Pri malých vzorkách (zvyčajne n < 30) treba pri zostavovaní intervalov namiesto normálneho rozdelenia použiť Studentovo t-rozdelenie s df = n − 1.

Praktický príklad

Predpokladajme, že máme vzorku n = 25 a vzorkovú štandardnú odchýlku s = 10. Potom

SE = 10 / sqrt(25) = 10 / 5 = 2.

Ak je vzorkový priemer 50, približný 95% interval spoľahlivosti (pri použití z- hodnoty 1,96) je:

50 ± 1,96 × 2 = 50 ± 3,92 → (46,08 ; 53,92).

Tento interval nám hovorí, že ak by sme opakovane brali vzorky tej istej veľkosti, približne 95 % takých intervalov by obsahovalo skutočný populačný priemer.

Faktory ovplyvňujúce SE

  • Veľkosť vzorky (n): SE klesá so zvýšením n podľa vzťahu 1 / sqrt(n). Získanie štyrikrát väčšej vzorky zníži SE približne na polovicu.
  • Variabilita v dátach (s alebo σ): Väčšia štandardná odchýlka vedie k väčšiemu SE – ak sú hodnoty vo vzorke veľmi rozptýlené, priemer je neistý.
  • Odber bez náhrady z konečnej populácie: Ak je populácia konečná a vzorka predstavuje značnú časť populácie, používa sa korekčný faktor (finite population correction, FPC):

SE_korigované = (s / sqrt(n)) × sqrt((N − n) / (N − 1)), kde N je veľkosť populácie.

Štandardná chyba priemeru verzus štandardná odchýlka

  • Štandardná odchýlka (SD) popisuje rozptyl jednotlivých dátových bodov okolo priemeru v jednej vzorke alebo populácii.
  • Štandardná chyba (SE) popisuje neistotu v odhade samotného priemeru (koľko sa priemer môže líšiť od vzorky k vzorke).
  • Jednoducho: SD meria variabilitu dát, SE meria presnosť odhadu priemeru.

Ďalšie poznámky a bežné chyby

  • Pre proporcie p v binárnych dátach platí: SE_p = sqrt(p(1 − p) / n).
  • Pri malých vzorkách používajte t-intervaly (Studentovo t-rozdelenie) namiesto z-intervalov, ak nie je známa σ.
  • Nezamieňať SE s chybou merania — SE sa týka náhodnej chyby odberu vzorky, nie systematickej chyby zariadenia.
  • SE má rovnaké jednotky ako meraná veličina (rovnako ako priemer), takže jeho interpretácia je priamočíra.

Zhrnutie

Štandardná chyba priemeru je kľúčová pre posúdenie spoľahlivosti odhadu populačného priemeru z jednej vzorky. Počíta sa ako pomer štandardnej odchýlky (σ alebo s) a druhého koreňa z veľkosti vzorky (sqrt(n)). Menší SE znamená presnejší odhad; znižuje sa so zvyšujúcou sa veľkosťou vzorky alebo so znížením variability v dátach. Pri konečných populáciách a pri odberoch bez náhrady treba zvážiť korekciu FPC. Pri tvorbe intervalov spoľahlivosti a testovaní hypotéz zohráva SE ústrednú úlohu.