ASCII: definícia a história amerického štandardného kódu znakov

ASCII: definícia a história amerického štandardného kódu znakov — prehľad vzniku v 60. rokoch, 128 znakov, riadiace aj tlačiteľné symboly a význam pre spracovanie textu.

Autor: Leandro Alegsa

ASCII (vyslovuje sa az-kee, v americkom jazyku ass-key) je štandardná tabuľka znakov používaná v počítače a v komunikácii medzi nimi. Ide o binárny kód, ktorý elektronické zariadenia používajú na reprezentáciu textu pomocou anglickej abecedy, číslic a bežných symbolov. Skratka ASCII znamená American Standard Code for Information Interchange (Americký štandardný kód pre výmenu informácií). Bol vyvinutý v 60. rokoch 20. storočia, vychádzal zo starších riešení používaných v telegrafných a teletype systémoch a jeho prvá norma vznikla v začiatkoch 60. rokov (následne revidovaná v 60. rokoch).

Základná štruktúra a rozsah

Pôvodné ASCII je 7-bitový kód, ktorý definuje 128 rôznych hodnôt (0–127). Týchto 128 znakov zahŕňa:

  • kódované tlačiteľné znaky (medzera, písmená A–Z a a–z, číslice 0–9, interpunkcia a ďalšie symboly),
  • riadiace znaky (control characters) používané na riadenie prenosu a zobrazenia textu, ktoré sa nedajú priamo vytlačiť).
Tlačiteľné znaky zvyčajne majú kódy 32–126; kód 127 je rezervovaný pre znak DEL (delete).

Príklad kódovania

Veľa implementácií ukladá ASCII znaky v 8-bitovom bajtu, pričom najvyšší bit (osmý bit) bol historicky použitý ako paritný bit alebo pre rozšírenia. Napríklad veľké písmeno A je v ASCII reprezentované binárne: 1000001 (7-bit), čo zodpovedá 65 v desiatkovej sústave a 41 v hexadecimálnej sústave. Podobne B = 1000010, C = 1000011 a ďalej.

Riadiace znaky (príklady)

Mnohé riadiace znaky už dnes nie sú bežne používané v pôvodnom zmysle, no sú súčasťou štandardu. Medzi známe patrí:

  • NUL (0) – často používaný ako terminátor reťazcov v programovaní,
  • BEL (7) – signál zvonenia (bell),
  • BS (8) – backspace,
  • TAB (9) – horizontálny tabulátor,
  • LF (10) – line feed (nový riadok),
  • CR (13) – carriage return (návrat k začiatku riadka),
  • ESC (27) – escape,
  • DEL (127) – delete.
V tabuľkách ASCII sa riadiace znaky často nachádzajú v ľavom stĺpci. Pretože pôvodné zariadenia (napr. tlačiarne, televysorové terminály) používali tieto kódy na ovládanie, mnoho z nich dnes nemá priame použitie pri formátovaní textu (napr. pre tučné písmo alebo kurzívu).

Parita, prenos a histórie použitia

Keď sa ASCII prenášal cez sériové linky alebo modemy, často sa používal 8. bit v byte ako paritný bit na detekciu chýb pri prenose – to bolo dôležité v dobe, keď boli prenosy často zašumené. Neskôr, s rozšírením spoľahlivejších protokolov prenosu a s 8-bitovými kanálmi, sa začali objavovať 8-bitové rozšírenia ASCII (tzv. rozšírené ASCII), ktoré pridávali ďalších 128 znakov (kódy 128–255) na podporu miestnych písomných systémov a diakritiky.

Rozšírenia a nástup Unicode

Rôzne „code pages“ a štandardy (napr. ISO‑8859‑1, Windows‑1252) používali 8-bitové rozšírenia ASCII, ktoré však neboli navzájom vždy kompatibilné. Dnes väčšinu týchto problémov rieši Unicode, ktorý obsahuje ASCII ako svoj úzky základ — prvých 128 kódových bodov Unicode sú presne hodnoty ASCII. Preto je ASCII prakticky podmnožinou Unicode a moderné systémy namiesto rôznych kódových stránok používajú univerzálny Unicode (UTF-8, UTF-16 a pod.).

Použitie dnes

Termín „ASCII súbor“ sa často používa na označenie súboru s obyčajný text, teda bez formátovacích informácií (štýlov, fontov). ASCII zostáva dôležitý pre protokoly internetovej komunikácie (napr. e‑mailové hlavičky, príslušné časti HTTP), skriptovanie, programovanie a pri základnej interoperabilite medzi systémami.

Stručná rekapitulácia:

  • ASCII = pôvodne 7-bitový kód (128 znakov).
  • Ukladanie v 8-bitových bytoch umožnilo použitie paritného bitu a neskôr rozšírení.
  • Kontrolné znaky (0–31, 127) riadia prenos a spracovanie textu; tlačiteľné sú v rozsahu 32–126.
  • ASCII je historicky dôležitý a je plne zachovaný ako podmnožina Unicode.

95 grafických znakov ASCII s číslami 32 až 126 (v desiatkovej sústave)Zoom
95 grafických znakov ASCII s číslami 32 až 126 (v desiatkovej sústave)

Rozšírené ASCII

ASCII nemá diakritické znamienka (značky, ktoré sa pridávajú k písmenu, ako sú bodky (umlauts) nad samohláskami v nemčine alebo tilda (~) nad písmenom "n" pre písmeno "ñ" používané v španielčine). Bola určená len pre angličtinu a pre väčšinu ostatných jazykov nefunguje dobre. Niektoré anglické slová prevzaté z iných jazykov používajú tieto značky tiež, napríklad resumé (pozri Príloha:Anglické slová s diakritikou).

To viedlo k tomu, že niektoré systémy používali 8 bitov (celý bajt) namiesto 7 bitov. Správny názov pre systémy, ktoré používajú 8 bitov, sa nazýva rozšírená ASCII. Osem bitov umožňuje 256 znakov. Prvých 128 znakov musí byť rovnakých ako pri ASCII a zvyšok sa zvyčajne používa pre písmená abecedy s diakritikou, napríklad É, È, Î a Ü. To rieši problém pre jazyky, ktoré sú založené na latinke, hoci nie všetky rozšírené systémy ASCII sú rovnaké. Iné abecedy, ako napríklad grécka abeceda, cyrilika, potrebujú iný súbor znakov. A niektoré systémy, ako napríklad tie, ktoré používajú čínske znaky, stále nefungujú, pretože používajú tisíce znakov. Preto bol vytvorený systém unicode, ktorý má mať jeden spoločný systém pre všetky jazyky.

Štandard ASCII sa stále bežne používa, najmä v počítačovom softvéri a súboroch HTML. Do roku 2010 bol štandardom pre adresy URL. Webové stránky, ktoré majú polia na zadávanie textu, často prijímajú len text ASCII. Akékoľvek špeciálne značky pre tučné písmo alebo centrovaný text atď. sa zobrazia nesprávne.

ASCII-Table-wide

Otázky a odpovede

Otázka: Čo je ASCII?


Odpoveď: ASCII je tabuľka znakov pre počítače, ktorá používa binárny kód na spracovanie textu pomocou anglickej abecedy, čísel a iných bežných symbolov.

Otázka: Čo znamená skratka ASCII?


A: ASCII znamená American Standard Code for Information Interchange (Americký štandardný kód pre výmenu informácií).

Otázka: Kedy bol ASCII vytvorený?


Odpoveď: ASCII bol vyvinutý v 60. rokoch 20. storočia.

Otázka: Koľko znakov obsahuje kód?


Odpoveď: Kód obsahuje definície 128 znakov, ktorým sú pridelené čísla od 0 do 127.

Otázka: Koľko bitov je potrebných na reprezentáciu znaku ASCII?


Odpoveď: Na reprezentáciu znaku ASCII je potrebných 7 binárnych číslic (bitov).

Otázka: Používa počítačový súbor ASCII jeden bajt na jeden znak?


Odpoveď: Áno, počítačový súbor ASCII používa jeden bajt na znak, pričom na jeden bajt pripadá 8 bitov.

Otázka: Používa sa štandard ASCII bežne aj dnes? Odpoveď: Áno, štandard ASCI sa dnes stále bežne používa, najmä v počítačovom softvéri a súboroch HTML.


Prehľadať
AlegsaOnline.com - 2020 / 2025 - License CC3