Riadené prirodzené jazyky (CNL – Controlled Natural Languages) sú umelo navrhnuté varianty prirodzených jazykov, ktoré sa dosahujú zjednodušením gramatiky, obmedzením slovnej zásoby a stanovením jasných pravidiel písania. Cieľom je zredukovať nejednoznačnosti a zložitosti, zlepšiť porozumenie medzi ľuďmi a umožniť automatickú spracovateľnosť textu počítačmi.

Typy riadených jazykov

Rozlišujeme dva základné typy CNL:

  • Zjednodušené alebo technické jazyky – sú navrhnuté primárne pre ľudí. Slúžia na zrozumiteľnejšie technické dokumenty, bezpečnostné pokyny a lepší medzi-jazykový preklad. Používajú ich podniky, letecký priemysel, výroba alebo technické oddelenia. Medzi známe príklady patria ASD Simplified Technical English (ASD-STE), Caterpillar Technical English a IBM Easy English.
  • Formálne riadené jazyky – majú presne definované pravidlá, ktoré umožňujú preklad do formálnych reprezentácií (napr. logika prvého rádu). Takéto jazyky umožňujú automatickú sémantickú analýzu, overovanie konzistencie a strojové odôvodňovanie. Príklady zahŕňajú Attempto Controlled English (ACE) alebo PENG (Processable English).

Zásady a typické pravidlá

Zjednodušené (alebo odborné) jazyky často poskytujú autorom konkrétne smernice, napríklad:

  • písať krátke a jednoduché vety", aby bola každá veta ľahko spracovateľná a pochopiteľná;
  • používať konzistentnú terminológiu – vybrať jedno pevné pomenovanie pre každý pojem;
  • preferovať aktívny rod a uvádzať, kto vykonáva činnosť (napr. používať meno osoby, ako "John Smith", namiesto neurčitých zámen ako "on");
  • písať jednu myšlienku alebo akciu na vetu a vyhýbať sa zložitým kombináciám viet;
  • vyhýbať sa viacnásobným významom slov, metaforám a idiomom;
  • pokiaľ je to možné, hovoriť o tom, kto niečo robí, a nie len o tom, čo sa robí, pokiaľ nie je potrebné povedať inak.

Formálne CNL a ich schopnosti

Druhý typ riadených jazykov má gramatiku a slovník dostatočne presne špecifikované, aby texty mohli byť jednoznačne preložené do formálnych logických výrazov. To prináša nasledovné výhody:

  • možnosť automatického overovania správnosti a konzistencie tvrdení;
  • dotazovanie a vyhľadávanie informácií pomocou logických dotazov;
  • automatické odvozovanie záverov (reasoning) a kontrola protichodných požiadaviek;
  • integrácia s ontológiami a systémami reprezentácie znalostí.

Príklad jednoduchej vety v kontrolovanom angličtine, ktorá sa bez problémov mapuje do logiky: "Every employee who manages a project is responsible for that project." V CNL sa podobné vety formalizujú tak, aby nástroj mohol generovať zodpovedajúce logické pravidlá a overovať ich.

Aplikácie a nástroje

Riadené jazyky sa používajú v mnohých oblastiach:

  • technická dokumentácia a návody (zníženie chýb pri používaní zariadení, lepší preklad do iných jazykov);
  • tvorba a kontrola požiadaviek v softvérovom inžinierstve (jasné, jednoznačné požiadavky);
  • legislatíva a zmluvy (zrozumiteľnosť a automatizovaná kontrola);
  • znalostné bázy, chatboti a systémy otázok a odpovedí, kde je nutná spoľahlivá interpretácia vstupu;
  • bezpečnostné a prevádzkové procedúry v letectve, vojenskom a priemyselnom prostredí.

Existujú nástroje na kontrolu súladu s pravidlami CNL (checkery), prekladače do formálneho zápisu, a editori so zabudovanou podporou slovníkov a pravidiel. Zavedenie takýchto nástrojov uľahčuje udržiavanie kvality textov a export do strojovo spracovateľných formátov.

Výhody a obmedzenia

Výhody:

  • zvýšená presnosť a zrozumiteľnosť textov;
  • jednoduchšia automatická analýza a spracovanie;
  • lepší a lacnejší preklad dokumentov;
  • možnosť overovania a automatizovaného odvodzovania záverov.

Obmedzenia:

  • znížená vyjadrovacia bohatost – nie všetky nuansy prirodzeného jazyka sú zachovateľné;
  • nutnosť udržiavať a spravovať slovníky a pravidlá, často v špecifickej doméne;
  • pre niektorých autorov môže byť písanie v CNL menej prirodzené, vyžaduje školenie a prax;
  • pri nesprávnej implementácii môže vzniknúť falošný dojem úplnej jednoznačnosti.

Odporúčané postupy pri zavádzaní CNL

  • definovať jasné pravidlá a tvorcov slovníkov špecifických pre doménu;
  • vyškoliť autorov a poskytovať im nástroje na kontrolu a automatickú spätnú väzbu;
  • používať aktívny hlas, krátke vety a konzistentnú terminológiu;
  • testovať mapovanie textov do formálnych reprezentácií a overovať ich použiteľnosť v cieľových systémoch.

Riadené prirodzené jazyky predstavujú praktický kompromis medzi ľudsky čitateľným textom a strojovou spracovateľnosťou. Správne navrhnuté a implementované CNL zlepšujú komunikáciu, znižujú chyby a otvárajú možnosti automatizovaného spracovania znalostí v rôznych odvetviach.