Štandardná chyba

Autor: Leandro Alegsa

18-01-2022 18:57

Štandardná chyba je štandardná odchýlka výberového rozdelenia štatistiky. Tento termín sa môže používať aj pre odhad (dobrý odhad) tejto štandardnej odchýlky získanej zo vzorky celej skupiny.

Priemer určitej časti skupiny (nazývanej vzorka) je obvyklý spôsob odhadu priemeru pre celú skupinu. Meranie celej skupiny je často príliš náročné alebo stojí príliš veľa peňazí. Ak sa však zmeria iná vzorka, bude mať priemer, ktorý sa bude trochu líšiť od prvej vzorky. Štandardná chyba priemeru je spôsob, ako zistiť, ako blízko je priemer vzorky k priemeru celej skupiny. Je to spôsob, ako zistiť, nakoľko si môžete byť istí priemerom zo vzorky.

Pri skutočných meraniach skutočná hodnota štandardnej odchýlky priemeru pre celú skupinu zvyčajne nie je známa. Preto sa termín štandardná chyba často používa na označenie blízkeho odhadu skutočného čísla pre celú skupinu. Čím viac meraní je vo vzorke, tým bližšie bude odhad k skutočnému číslu pre celú skupinu.

Pre hodnotu, ktorá sa vyberá s neskreslenou normálne rozdelenou chybou, je vyššie znázornený podiel vzoriek, ktoré by spadali do intervalu 0, 1, 2 a 3 štandardných odchýlok nad a pod skutočnú hodnotu.

Ako zistiť štandardnú chybu priemeru

Jedným zo spôsobov, ako zistiť štandardnú chybu priemeru, je mať veľa vzoriek. Najprv sa zistí priemer pre každú vzorku. Potom sa zistí priemer a štandardná odchýlka týchto priemerov vzoriek. Štandardná odchýlka všetkých priemerov vzoriek je štandardná chyba priemeru. To môže byť veľmi pracné. Niekedy je príliš náročné alebo stojí príliš veľa peňazí mať veľa vzoriek.

Ďalším spôsobom, ako zistiť štandardnú chybu priemeru, je použiť rovnicu, ktorá potrebuje len jednu vzorku. Štandardná chyba priemeru sa zvyčajne odhaduje štandardnou odchýlkou pre vzorku z celej skupiny (štandardná odchýlka vzorky) vydelenou druhou odmocninou veľkosti vzorky.

S E x Ž = s n {\displaystyle SE_{\bar {x}} ={\frac {s}{\sqrt {n}}}} $SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}$

kde

s je štandardná odchýlka vzorky (t. j. odhad štandardnej odchýlky populácie na základe vzorky) a

n je počet meraní vo vzorke.

Aká veľká musí byť vzorka, aby sa odhad štandardnej chyby priemeru blížil skutočnej štandardnej chybe priemeru celej skupiny? Vo vzorke by malo byť aspoň šesť meraní. Potom štandardná chyba priemeru pre vzorku bude v rozmedzí 5 % štandardnej chyby priemeru, ak by sa merala celá skupina.

Opravy niektorých prípadov

Ak sa počet meraní týka 5 % alebo viac celej skupiny, je potrebné použiť inú rovnicu:

Ak má vzorka menej ako 20 meraní, je potrebné použiť špeciálne rovnice.

Niekedy vzorka pochádza z jedného miesta, hoci celá skupina môže byť rozptýlená. Niekedy sa tiež môže stať, že vzorka vznikne v krátkom časovom období, hoci celá skupina pokrýva dlhší čas. V takom prípade nie sú počty vo vzorke nezávislé. Vtedy sa používajú špeciálne rovnice, ktoré sa to snažia korigovať.

Užitočnosť

Praktický výsledok: Viac meraní vo vzorke zvyšuje istotu priemernej hodnoty. Potom bude štandardná chyba priemeru menšia, pretože štandardná odchýlka je delená väčším číslom. Aby však neistota (štandardná chyba priemeru) priemernej hodnoty bola o polovicu menšia, veľkosť vzorky (n) musí byť štyrikrát väčšia. Je to preto, že štandardná odchýlka sa delí druhou odmocninou veľkosti vzorky. Aby bola neistota o desatinu väčšia, musí byť veľkosť vzorky (n) stokrát väčšia!

Štandardné chyby sa dajú ľahko vypočítať a často sa používajú, pretože:

Ak je známa štandardná chyba niekoľkých jednotlivých veličín, potom sa dá v mnohých prípadoch ľahko vypočítať štandardná chyba určitej funkcie veličín;
Ak je známe rozdelenie pravdepodobnosti hodnoty, možno ho použiť na výpočet dobrej aproximácie presného intervalu spoľahlivosti a
Ak rozdelenie pravdepodobnosti nie je známe, na odhad intervalu spoľahlivosti možno použiť iné rovnice
Keď sa veľkosť vzorky veľmi zväčší, princíp centrálnej limitnej vety ukazuje, že čísla vo vzorke sú veľmi podobné číslam v celej skupine (majú normálne rozdelenie).

Relatívna štandardná chyba

Relatívna štandardná chyba (RSE) je štandardná chyba vydelená priemerom. Toto číslo je menšie ako jedna. Ak ho vynásobíme 100 %, dostaneme ho ako percento priemeru. To pomáha ukázať, či je neistota dôležitá alebo nie. Uvažujme napríklad dva prieskumy príjmov domácností, ktorých výsledkom je priemer vzorky 50 000 USD. Ak má jeden prieskum štandardnú chybu 10 000 USD a druhý má štandardnú chybu 5 000 USD, potom sú relatívne štandardné chyby 20 % a 10 %. Prieskum s nižšou relatívnou štandardnou chybou je lepší, pretože má presnejšie meranie (neistota je menšia).

Ľudia, ktorí potrebujú poznať priemerné hodnoty, sa v skutočnosti často rozhodujú, aká malá by mala byť neistota, skôr než sa rozhodnú informáciu použiť. Napríklad americké Národné centrum pre zdravotnícku štatistiku neuvádza priemer, ak relatívna štandardná chyba presiahne 30 %. NCHS tiež vyžaduje aspoň 30 pozorovaní, aby sa odhad mohol uviesť. ^[]

Príklad

Napríklad vo vodách Mexického zálivu je veľa okúníkov. Ak chcete zistiť, koľko v priemere váži 42 cm dlhý okúň, nie je možné zmerať všetkých okúňov, ktorí majú 42 cm. Namiesto toho je možné zmerať niektoré z nich. Ryby, ktoré sa skutočne zmerajú, sa nazývajú vzorka. V tabuľke sú uvedené hmotnosti dvoch vzoriek sebastesov, ktoré sú všetky dlhé 42 cm. Priemerná (stredná) hmotnosť prvej vzorky je 0,741 kg. Priemerná (stredná) hmotnosť druhej vzorky je 0,735 kg, čo je o niečo menej ako hmotnosť prvej vzorky. Každý z týchto priemerov sa trochu líši od priemeru, ktorý by vznikol meraním každého 42 cm dlhého okúňa (čo aj tak nie je možné).

Neistotu priemeru možno použiť na zistenie, ako blízko je priemer vzoriek k priemeru, ktorý by vznikol meraním celej skupiny. Neistota priemeru sa odhaduje ako štandardná odchýlka pre vzorku vydelená druhou odmocninou z počtu vzoriek mínus jedna. Z tabuľky vyplýva, že neistoty priemerov pre dve vzorky sú si veľmi blízke. Aj relatívna neistota je neistota v priemere vydelená priemerom krát 100 %. Relatívna neistota v tomto príklade je 2,38 % a 2,50 % pre dve vzorky.

Ak poznáme neistotu priemeru, môžeme zistiť, ako blízko je priemer vzorky k priemeru, ktorý by bol výsledkom merania celej skupiny. Priemer pre celú skupinu je medzi a) priemerom pre vzorku plus neistota priemeru a b) priemerom pre vzorku mínus neistota priemeru. V tomto príklade sa očakáva, že priemerná hmotnosť všetkých 42 cm dlhých sebastesov v Mexickom zálive bude 0,723 - 0,759 kg na základe prvej vzorky a 0,717 - 0,753 na základe druhej vzorky.

Príklad červenice (známej aj ako červený bubon, Sciaenops ocellatus) použitej v príklade.

Otázky a odpovede

Otázka: Čo je to štandardná chyba?

Odpoveď: Štandardná chyba je štandardná odchýlka výberového rozdelenia štatistiky.

Otázka: Môže sa pojem štandardná chyba použiť pre odhad štandardnej odchýlky?

Odpoveď: Áno, termín štandardná chyba sa môže použiť pre odhad (dobrý odhad) tejto štandardnej odchýlky získanej zo vzorky celej skupiny.

Otázka: Ako sa odhaduje priemer pre celú skupinu?

Odpoveď: Priemer určitej časti skupiny (nazývanej vzorka) je obvyklý spôsob odhadu priemeru pre celú skupinu.

Otázka: Prečo je ťažké merať celú skupinu?

Odpoveď: Často je príliš ťažké alebo príliš nákladné merať celú skupinu.

Otázka: Čo je to štandardná chyba priemeru a čo určuje?

Odpoveď: Štandardná chyba priemeru je spôsob, ako zistiť, ako blízko je priemer vzorky k priemeru celej skupiny. Je to spôsob, ako zistiť, nakoľko si môžeme byť istí priemerom zo vzorky.

Otázka: Je skutočná hodnota štandardnej odchýlky priemeru pri reálnych meraniach zvyčajne známa?

Odpoveď: Nie, skutočná hodnota smerodajnej odchýlky priemeru pre celú skupinu zvyčajne nie je pri reálnych meraniach známa.

Otázka: Ako ovplyvňuje počet meraní vo vzorke presnosť odhadu?

Odpoveď: Čím viac meraní je vo vzorke, tým bližšie bude odhad k skutočnému číslu pre celú skupinu.

Prehľadať