Ukážka

V štatistike je vzorka súčasťou populácie. Vzorka je starostlivo vybraná. Mala by spravodlivo reprezentovať celú populáciu bez skreslenia. Vzorky sú potrebné preto, lebo populácie môžu byť také veľké, že spočítanie všetkých jedincov nemusí byť možné alebo praktické.

Preto sa riešenie problému v štatistike zvyčajne začína výberom vzorky. Výber vzorky je o výbere údajov, ktoré sa majú vziať na neskoršiu analýzu. Ako príklad uveďme, že na účely štúdie je potrebné analyzovať znečistenie jazera. V závislosti od toho, kde boli vzorky vody odobraté, môžu mať štúdie rôzne výsledky. Všeobecne platí, že vzorky musia byť náhodné. To znamená, že šanca alebo pravdepodobnosť výberu jedného jedinca je rovnaká ako šanca výberu akéhokoľvek iného jedinca.

V praxi sa náhodné vzorky vždy vyberajú pomocou presne definovaného postupu. Postup je súbor pravidiel, postupnosť krokov napísaná na papieri a do bodky dodržaná. Aj napriek tomu môže vo vzorke zostať určité skreslenie. Zoberme si problém navrhovania vzorky na predpovedanie výsledku volebného prieskumu. Všetky známe metódy majú svoje problémy a výsledky volieb sa často líšia od predpovedí založených na vzorke. Ak sa názory zisťujú pomocou telefónov alebo stretnutím s ľuďmi na ulici, vzorka má vždy skreslenie. Preto v prípadoch, ako je tento, nikdy nie je možné získať úplne neutrálnu vzorku. V takýchto prípadoch sa štatistik zamyslí nad tým, ako zmerať veľkosť skreslenia, a existujú spôsoby, ako ho odhadnúť.

Podobná situácia nastáva, keď vedci merajú fyzikálnu vlastnosť, napríklad hmotnosť kusu kovu alebo rýchlosť svetla. Ak vážime objekt citlivým zariadením, dostaneme nepatrne odlišné výsledky. Žiadny systém merania nie je nikdy dokonalý. Dostávame sériu odhadov, pričom každý z nich je meraním. Sú to vzorky s určitým stupňom chyby. Štatistika je určená na opis chýb a na vykonávanie analýzy tohto druhu údajov.

Existujú rôzne druhy vzoriek:

Hraničná polícia hľadá nelegálne drogy pomocou špeciálne vycvičeného psa: Ak skontrolujú každé desiate auto, odoberú objektívnu vzorku.Zoom
Hraničná polícia hľadá nelegálne drogy pomocou špeciálne vycvičeného psa: Ak skontrolujú každé desiate auto, odoberú objektívnu vzorku.

Stratifikovaný výber vzoriek

Ak má populácia zjavné subpopulácie, potom je potrebné odobrať vzorku z každej subpopulácie. Tento postup sa nazýva stratifikovaný výber. Stratifikovaný výber je známy aj ako stratifikovaná náhodná vzorka. Stratifikovaný výber sa často vyjadruje ako podiel, napríklad v percentách (%).

Predpokladajme, že sa uskutoční experiment, ktorého cieľom je získať vzorku príjmov dospelých. Je zrejmé, že príjmy absolventov vysokých škôl sa môžu líšiť od príjmov osôb bez vysokoškolského vzdelania. Teraz predpokladajme, že počet absolventov mužského pohlavia tvorí 30 % z celkového počtu dospelých mužov (imaginárne údaje). Potom by ste zariadili, aby 30 % z celkovej vzorky tvorili náhodne vybraní absolventi mužského pohlavia a 70 % z celkového počtu by tvorili muži, ktorí nie sú absolventmi. Postup zopakujte aj pre ženy, pretože percento absolventiek sa líši od percenta mužov. Takto získate vzorku dospelej populácie rozvrstvenú podľa pohlavia a vysokoškolského vzdelania. Ďalším krokom by malo byť rozdelenie každej z vašich podskupín podľa vekových skupín, pretože (napríklad) absolventi by mohli získať väčší príjem v porovnaní s neabsolventmi v strednom veku.

Ďalší typ stratifikovanej vzorky sa zaoberá variabilitou. V tomto prípade sa z variabilnejších subpopulácií vyberajú väčšie vzorky, aby boli súhrnné štatistiky, ako sú stredné hodnoty a štandardné odchýlky, spoľahlivejšie.

Otázky a odpovede

Otázka: Čo je to vzorka v štatistike?


Odpoveď: V štatistike je vzorka časť populácie, ktorá bola starostlivo vybraná tak, aby spravodlivo a bez skreslenia reprezentovala celú populáciu.

Otázka: Prečo sú potrebné vzorky?


Odpoveď: Vzorky sú potrebné, pretože populácia môže byť taká veľká, že spočítanie všetkých jednotlivcov nemusí byť možné alebo praktické. Preto sa riešenie problému v štatistike zvyčajne začína výberom vzoriek.

Otázka: Ako sa reprezentuje vzorka?


Odpoveď: Keď sa vzorka považuje za súbor údajov, často sa reprezentuje veľkými písmenami, ako napríklad X a Y, pričom jej prvky sú reprezentované malými písmenami (napr. x3) a veľkosť vzorky je reprezentovaná písmenom n.

Otázka: Aké by mali byť vzorky?


Odpoveď: Všeobecne platí, že vzorky musia byť náhodné, čo znamená, že šanca alebo pravdepodobnosť výberu jedného jedinca je rovnaká ako šanca výberu akéhokoľvek iného jedinca. V praxi sa náhodné vzorky vždy vyberajú pomocou presne definovaného postupu.

Otázka: Môže vo vzorkách zostať skreslenie?


Odpoveď: Aj pri použití presne definovaných postupov na výber vzoriek môže vo vzorke zostať určitá odchýlka spôsobená faktormi, ako napríklad tým, kto odpovedá na telefónne hovory alebo kto chodí po určitých uliciach, keď sa zbierajú názory na predpovedanie volebného prieskumu. V takýchto prípadoch môže byť ťažké získať úplne neutrálne vzorky, ale štatistici môžu zmerať, aká veľká zaujatosť zostáva prítomná.

Otázka: Existujú rôzne druhy vzoriek?


Odpoveď: Áno, existujú rôzne druhy vzoriek vrátane úplných vzoriek, ktoré zahŕňajú všetky prvky, ktoré majú dané vlastnosti, a nestranných/reprezentatívnych vzoriek, ktoré zahŕňajú výber prvkov z úplných vzoriek bez závislosti od ich vlastností. Spôsob získania vzorky spolu s jej veľkosťou ovplyvní spôsob, akým sa na údaje pozerá.

AlegsaOnline.com - 2020 / 2023 - License CC3