Zipfov zákon

Zipfov zákon je empirický zákon formulovaný pomocou matematickej štatistiky, pomenovaný podľa lingvistu Georgea Kingsleyho Zipfa, ktorý ho navrhol ako prvý.

Zipfov zákon hovorí, že pri veľkej vzorke použitých slov je frekvencia akéhokoľvek slova nepriamo úmerná jeho poradiu v tabuľke frekvencií. Takže slovo číslo nfrekvenciu úmernú 1/n.

Najfrekventovanejšie slovo sa teda bude vyskytovať približne dvakrát častejšie ako druhé najfrekventovanejšie slovo, trikrát častejšie ako tretie najfrekventovanejšie slovo atď. Napríklad v jednej vzorke slov v anglickom jazyku predstavuje najčastejšie sa vyskytujúce slovo "the" takmer 7 % všetkých slov (69 971 z niečo viac ako 1 milióna). V súlade so Zipfovým zákonom slovo "of", ktoré je na druhom mieste, predstavuje niečo vyše 3,5 % slov (36 411 výskytov), za ním nasleduje slovo "and" (28 852). Na to, aby sa vo veľkej vzorke vyskytla polovica slov, je potrebných len približne 135 slov.

Rovnaký vzťah sa vyskytuje aj v mnohých iných rebríčkoch, ktoré nesúvisia s jazykom, napríklad v rebríčkoch počtu obyvateľov miest v rôznych krajinách, veľkosti korporácií, príjmu atď. Výskyt rozdelenia v rebríčkoch miest podľa počtu obyvateľov si prvýkrát všimol Felix Auerbach v roku 1913.

Nie je známe, prečo Zipfov zákon platí pre väčšinu jazykov.

Otázky a odpovede

Otázka: Čo je Zipfov zákon?


Odpoveď: Zipfov zákon je empirický zákon, ktorý hovorí, že frekvencia slova vo veľkej vzorke je nepriamo úmerná jeho poradiu v tabuľke frekvencií.

Otázka: Kto navrhol Zipfov zákon?


Odpoveď: Zipfov zákon prvýkrát navrhol lingvista George Kingsley Zipf.

Otázka: Ako Zipfov zákon vysvetľuje frekvenciu slov vo vzorke anglických slov?


Odpoveď: Podľa Zipfovho zákona sa najfrekventovanejšie slovo vo vzorke anglických slov vyskytuje približne dvakrát častejšie ako druhé najfrekventovanejšie slovo, trikrát častejšie ako tretie najfrekventovanejšie slovo atď. Tento trend pokračuje s klesajúcou hodnosťou slova.

Otázka: Aké percento všetkých slov tvorí najčastejšie sa vyskytujúce slovo v jednej vzorke anglických slov?


Odpoveď: V jednej vzorke anglických slov tvorí najčastejšie sa vyskytujúce slovo ("the") takmer 7 % všetkých slov.

Otázka: Aký je vzťah medzi počtom slov potrebných na vytvorenie polovice vzorky a frekvenciou týchto slov?


Odpoveď: Podľa Zipfovho zákona je vo veľkej vzorke potrebných len približne 135 slov na to, aby sa vyjadrila polovica slov.

Otázka: Ktoré ďalšie rebríčky vykazujú Zipfov zákon?


Odpoveď: Rovnaký vzťah, aký opisuje Zipfov zákon pri frekvencii slov, sa vyskytuje aj v iných rebríčkoch, ktoré nesúvisia s jazykom, napríklad v rebríčkoch počtu obyvateľov miest v rôznych krajinách, veľkosti korporácií a príjmov.

Otázka: Kto si všimol výskyt rozdelenia v rebríčkoch miest podľa počtu obyvateľov?


Odpoveď: Výskyt distribúcie v rebríčkoch miest podľa počtu obyvateľov si ako prvý všimol Felix Auerbach v roku 1913.

AlegsaOnline.com - 2020 / 2023 - License CC3