V štatistike je interval spoľahlivosti špeciálnou formou odhadu určitého parametra. Pri tejto metóde sa namiesto jednej hodnoty uvádza celý interval prijateľných hodnôt parametra spolu s pravdepodobnosťou, že skutočná (neznáma) hodnota parametra bude v tomto intervale. Interval spoľahlivosti je založený na pozorovaniach zo vzorky, a preto sa od vzorky k vzorke líši. Pravdepodobnosť, že parameter bude v intervale, sa nazýva úroveň spoľahlivosti. Veľmi často sa udáva v percentách. Interval spoľahlivosti sa vždy uvádza spolu s úrovňou spoľahlivosti. Ľudia môžu hovoriť o "95 % intervale spoľahlivosti". Koncové body intervalu spoľahlivosti sa označujú ako hranice spoľahlivosti. Pre daný postup odhadu v danej situácii platí, že čím vyššia je úroveň spoľahlivosti, tým širší bude interval spoľahlivosti.
Výpočet intervalu spoľahlivosti si vo všeobecnosti vyžaduje predpoklady o povahe procesu odhadu - je to predovšetkým parametrická metóda. Jedným z bežných predpokladov je, že rozdelenie populácie, z ktorej pochádza vzorka, je normálne. Intervaly spoľahlivosti ako také, o ktorých sa hovorí ďalej, nie sú robustnou štatistikou, hoci je možné vykonať zmeny na zvýšenie robustnosti.
Ako sa interval spoľahlivosti konštruuje (základný princíp)
Základná forma prebodovaného intervalu spoľahlivosti má tvar:
odhadeň (estimator) ± kritická hodnota × štandardná chyba.
Príklad pre strednú hodnotu populácie μ:
- Ak poznáme smerodajnú odchýlku populácie σ: μ̂ ± z* × (σ / √n), kde z* je kritická hodnota z normálneho rozdelenia (napr. pre 95 % z* ≈ 1,96).
- Ak σ nepoznáme (bežnejší prípad): μ̂ ± t* × (s / √n), kde s je smerodajná odchýlka vzorky a t* je kvantil t-rozdelenia s n−1 stupňami voľnosti (pre malé n je t* väčšie než z*).
Interpretácia 95 % intervalu spoľahlivosti
- Frekventistická interpretácia: Pri opakovanom opakovaní tohto zisťovania a konštrukcii intervalu rovnakým spôsobom, približne 95 % takto vytvorených intervalov bude obsahovať pravú hodnotu parametra. To neznamená, že pravdepodobnosť 0,95 platí pre jednu konkrétnu už vypočítanú realizáciu intervalu (parameter je pevná, nie náhodná veličina).
- V bežnej komunikácii sa však často hovorí, že "je 95% pravdepodobné, že parameter leží v tomto intervale" — to je zjednodušenie, ktoré pochádza skôr z intuitívneho chápania než z prísnej frekventistickej definície.
Praktický príklad (výpočet 95 % CI pre priemer)
Predpokladajme vzorku s priemerom x̄ = 100, smerodajnou odchýlkou vzorky s = 15 a veľkosťou vzorky n = 25. Pre 95 % CI použijeme t-kvantil t_{24,0.975} ≈ 2,064:
95 % CI = 100 ± 2,064 × (15 / √25) = 100 ± 2,064 × 3 = 100 ± 6,192 = (93,81; 106,19).
Tento interval naznačuje, že pri použití rovnakého postupu by približne 95 % takto vypočítaných intervalov obsahovalo skutočnú hodnotu priemeru populácie.
Ďalšie typy intervalov a ich výpočty
- Pre podiel (proporciu) p: p̂ ± z* × √(p̂(1 − p̂) / n). Pri malých n alebo extrémnych p̂ sa odporúčajú opravené intervaly (Clopper–Pearson, Wilson, Agresti–Coull).
- Pre rozdiel dvoch priemerov: použije sa kombinácia štandardných chýb jednotlivých odhadov a prípadne korekcia pre nezhodné variancie (Welchov interval).
- Pre regresné koeficienty alebo iné parametre: intervaly sa dajú odvodiť zo štandardnej chyby odhadu a príslušného kvantilu rozdelenia (z alebo t), prípadne pomocou profilu alebo bootstrapu.
Vplyv veličín na šírku intervalu
- Zvýšenie úrovne spoľahlivosti (napr. z 95 % na 99 %) vedie k väčšej kritickej hodnote a teda k širšiemu intervalu.
- Zväčšenie veľkosti vzorky n znižuje štandardnú chybu (≈ 1/√n) a teda zužuje interval.
- Väčšia variabilita v dátach (väčšia s alebo σ) zväčšuje šírku intervalu.
Bežné omyly a upozornenia
- Neinterpretujte 95 % CI ako „pravdepodobnosť 0,95, že parameter je v tomto intervale“ v prísnom frekventistickom zmysle — tento výrok platí pre postup, nie pre jediný interval (viď vyššie).
- Ak interval obsahuje nulovú hodnotu pri rozdiele dvoch skupín, často sa to považuje za nedostatok štatistickej sily (nie nevyhnutne za „žiadny efekt“). Treba brať do úvahy veľkosť efektu a presnosť (šírku intervalu).
- Nesprávne použitie predpokladov (napr. normalita pri malých n) môže viesť k nepresným intervalom. V takých prípadoch zvážte neparametrické alebo bootstrap metódy.
Robustné alternatívy a bootstrap
Ak predpoklady parametrických metód nie sú splnené (nenormálne rozdelenie, odľahlé hodnoty, malé n), odporúčajú sa:
- Bootstrap intervaly spoľahlivosti – generovanie veľkého počtu vzoriek zo získanej vzorky pomocou resamplingu a odhad rozdelenia odhadov; poskytuje flexibilné a často spoľahlivejšie intervaly pri porušení predpokladov.
- Odhady založené na robustných štatistikách (medián, trimmed mean) s prispôsobenými intervalmi spoľahlivosti.
Rozdiel medzi intervalom spoľahlivosti a Bayesian‑ským „credible interval“
Bayesian‑ské intervaly (credible intervals) priamo predstavujú intervaly pre parameter, ku ktorým je možné priradiť pravdepodobnosť (podľa danej a posteriori distribúcie). To sa líši od frekventistického CI, ktorý hovorí o vlastnostiach postupu pri opakovaní experimentu.
Ako správne uvádzať interval spoľahlivosti vo výsledkoch
- Uvádzať úroveň spoľahlivosti (napr. 95 %), hodnotu odhadu (napr. priemer), dolnú a hornú hranicu intervalu a veľkosť vzorky (n).
- Uviesť metódu výpočtu (z‑interval, t‑interval, bootstrap, metóda pre proporcie) a prípadné dôležité predpoklady (normálnosť, známa/ neznáma σ atď.).
Zhrnutie
Interval spoľahlivosti je užitočný nástroj na vyjadrenie neistoty spojené s odhadom parametra. Správna interpretácia vyžaduje pochopenie, že ide o vlastnosť odhadovacieho postupu pri opakovaných pokusoch, nie o pravdepodobnosť pre jediné pozorovanie. Pri aplikácii je potrebné zvážiť predpoklady metódy a pri ich porušení zvážiť robustnejšie alebo neparametrické alternatívy, napríklad bootstrap.


