V štatistike je interval spoľahlivosti špeciálnou formou odhadu určitého parametra. Pri tejto metóde sa namiesto jednej hodnoty uvádza celý interval prijateľných hodnôt parametra spolu s pravdepodobnosťou, že skutočná (neznáma) hodnota parametra bude v tomto intervale. Interval spoľahlivosti je založený na pozorovaniach zo vzorky, a preto sa od vzorky k vzorke líši. Pravdepodobnosť, že parameter bude v intervale, sa nazýva úroveň spoľahlivosti. Veľmi často sa udáva v percentách. Interval spoľahlivosti sa vždy uvádza spolu s úrovňou spoľahlivosti. Ľudia môžu hovoriť o "95 % intervale spoľahlivosti". Koncové body intervalu spoľahlivosti sa označujú ako hranice spoľahlivosti. Pre daný postup odhadu v danej situácii platí, že čím vyššia je úroveň spoľahlivosti, tým širší bude interval spoľahlivosti.

Výpočet intervalu spoľahlivosti si vo všeobecnosti vyžaduje predpoklady o povahe procesu odhadu - je to predovšetkým parametrická metóda. Jedným z bežných predpokladov je, že rozdelenie populácie, z ktorej pochádza vzorka, je normálne. Intervaly spoľahlivosti ako také, o ktorých sa hovorí ďalej, nie sú robustnou štatistikou, hoci je možné vykonať zmeny na zvýšenie robustnosti.

Ako sa interval spoľahlivosti konštruuje (základný princíp)

Základná forma prebodovaného intervalu spoľahlivosti má tvar:

odhadeň (estimator) ± kritická hodnota × štandardná chyba.

Príklad pre strednú hodnotu populácie μ:

  • Ak poznáme smerodajnú odchýlku populácie σ: μ̂ ± z* × (σ / √n), kde z* je kritická hodnota z normálneho rozdelenia (napr. pre 95 % z* ≈ 1,96).
  • Ak σ nepoznáme (bežnejší prípad): μ̂ ± t* × (s / √n), kde s je smerodajná odchýlka vzorky a t* je kvantil t-rozdelenia s n−1 stupňami voľnosti (pre malé n je t* väčšie než z*).

Interpretácia 95 % intervalu spoľahlivosti

  • Frekventistická interpretácia: Pri opakovanom opakovaní tohto zisťovania a konštrukcii intervalu rovnakým spôsobom, približne 95 % takto vytvorených intervalov bude obsahovať pravú hodnotu parametra. To neznamená, že pravdepodobnosť 0,95 platí pre jednu konkrétnu už vypočítanú realizáciu intervalu (parameter je pevná, nie náhodná veličina).
  • V bežnej komunikácii sa však často hovorí, že "je 95% pravdepodobné, že parameter leží v tomto intervale" — to je zjednodušenie, ktoré pochádza skôr z intuitívneho chápania než z prísnej frekventistickej definície.

Praktický príklad (výpočet 95 % CI pre priemer)

Predpokladajme vzorku s priemerom x̄ = 100, smerodajnou odchýlkou vzorky s = 15 a veľkosťou vzorky n = 25. Pre 95 % CI použijeme t-kvantil t_{24,0.975} ≈ 2,064:

95 % CI = 100 ± 2,064 × (15 / √25) = 100 ± 2,064 × 3 = 100 ± 6,192 = (93,81; 106,19).

Tento interval naznačuje, že pri použití rovnakého postupu by približne 95 % takto vypočítaných intervalov obsahovalo skutočnú hodnotu priemeru populácie.

Ďalšie typy intervalov a ich výpočty

  • Pre podiel (proporciu) p: p̂ ± z* × √(p̂(1 − p̂) / n). Pri malých n alebo extrémnych p̂ sa odporúčajú opravené intervaly (Clopper–Pearson, Wilson, Agresti–Coull).
  • Pre rozdiel dvoch priemerov: použije sa kombinácia štandardných chýb jednotlivých odhadov a prípadne korekcia pre nezhodné variancie (Welchov interval).
  • Pre regresné koeficienty alebo iné parametre: intervaly sa dajú odvodiť zo štandardnej chyby odhadu a príslušného kvantilu rozdelenia (z alebo t), prípadne pomocou profilu alebo bootstrapu.

Vplyv veličín na šírku intervalu

  • Zvýšenie úrovne spoľahlivosti (napr. z 95 % na 99 %) vedie k väčšej kritickej hodnote a teda k širšiemu intervalu.
  • Zväčšenie veľkosti vzorky n znižuje štandardnú chybu (≈ 1/√n) a teda zužuje interval.
  • Väčšia variabilita v dátach (väčšia s alebo σ) zväčšuje šírku intervalu.

Bežné omyly a upozornenia

  • Neinterpretujte 95 % CI ako „pravdepodobnosť 0,95, že parameter je v tomto intervale“ v prísnom frekventistickom zmysle — tento výrok platí pre postup, nie pre jediný interval (viď vyššie).
  • Ak interval obsahuje nulovú hodnotu pri rozdiele dvoch skupín, často sa to považuje za nedostatok štatistickej sily (nie nevyhnutne za „žiadny efekt“). Treba brať do úvahy veľkosť efektu a presnosť (šírku intervalu).
  • Nesprávne použitie predpokladov (napr. normalita pri malých n) môže viesť k nepresným intervalom. V takých prípadoch zvážte neparametrické alebo bootstrap metódy.

Robustné alternatívy a bootstrap

Ak predpoklady parametrických metód nie sú splnené (nenormálne rozdelenie, odľahlé hodnoty, malé n), odporúčajú sa:

  • Bootstrap intervaly spoľahlivosti – generovanie veľkého počtu vzoriek zo získanej vzorky pomocou resamplingu a odhad rozdelenia odhadov; poskytuje flexibilné a často spoľahlivejšie intervaly pri porušení predpokladov.
  • Odhady založené na robustných štatistikách (medián, trimmed mean) s prispôsobenými intervalmi spoľahlivosti.

Rozdiel medzi intervalom spoľahlivosti a Bayesian‑ským „credible interval“

Bayesian‑ské intervaly (credible intervals) priamo predstavujú intervaly pre parameter, ku ktorým je možné priradiť pravdepodobnosť (podľa danej a posteriori distribúcie). To sa líši od frekventistického CI, ktorý hovorí o vlastnostiach postupu pri opakovaní experimentu.

Ako správne uvádzať interval spoľahlivosti vo výsledkoch

  • Uvádzať úroveň spoľahlivosti (napr. 95 %), hodnotu odhadu (napr. priemer), dolnú a hornú hranicu intervalu a veľkosť vzorky (n).
  • Uviesť metódu výpočtu (z‑interval, t‑interval, bootstrap, metóda pre proporcie) a prípadné dôležité predpoklady (normálnosť, známa/ neznáma σ atď.).

Zhrnutie

Interval spoľahlivosti je užitočný nástroj na vyjadrenie neistoty spojené s odhadom parametra. Správna interpretácia vyžaduje pochopenie, že ide o vlastnosť odhadovacieho postupu pri opakovaných pokusoch, nie o pravdepodobnosť pre jediné pozorovanie. Pri aplikácii je potrebné zvážiť predpoklady metódy a pri ich porušení zvážiť robustnejšie alebo neparametrické alternatívy, napríklad bootstrap.