Riadené prirodzené jazyky (CNL – Controlled Natural Languages) sú umelo navrhnuté varianty prirodzených jazykov, ktoré sa dosahujú zjednodušením gramatiky, obmedzením slovnej zásoby a stanovením jasných pravidiel písania. Cieľom je zredukovať nejednoznačnosti a zložitosti, zlepšiť porozumenie medzi ľuďmi a umožniť automatickú spracovateľnosť textu počítačmi.
Typy riadených jazykov
Rozlišujeme dva základné typy CNL:
- Zjednodušené alebo technické jazyky – sú navrhnuté primárne pre ľudí. Slúžia na zrozumiteľnejšie technické dokumenty, bezpečnostné pokyny a lepší medzi-jazykový preklad. Používajú ich podniky, letecký priemysel, výroba alebo technické oddelenia. Medzi známe príklady patria ASD Simplified Technical English (ASD-STE), Caterpillar Technical English a IBM Easy English.
- Formálne riadené jazyky – majú presne definované pravidlá, ktoré umožňujú preklad do formálnych reprezentácií (napr. logika prvého rádu). Takéto jazyky umožňujú automatickú sémantickú analýzu, overovanie konzistencie a strojové odôvodňovanie. Príklady zahŕňajú Attempto Controlled English (ACE) alebo PENG (Processable English).
Zásady a typické pravidlá
Zjednodušené (alebo odborné) jazyky často poskytujú autorom konkrétne smernice, napríklad:
- písať krátke a jednoduché vety", aby bola každá veta ľahko spracovateľná a pochopiteľná;
- používať konzistentnú terminológiu – vybrať jedno pevné pomenovanie pre každý pojem;
- preferovať aktívny rod a uvádzať, kto vykonáva činnosť (napr. používať meno osoby, ako "John Smith", namiesto neurčitých zámen ako "on");
- písať jednu myšlienku alebo akciu na vetu a vyhýbať sa zložitým kombináciám viet;
- vyhýbať sa viacnásobným významom slov, metaforám a idiomom;
- pokiaľ je to možné, hovoriť o tom, kto niečo robí, a nie len o tom, čo sa robí, pokiaľ nie je potrebné povedať inak.
Formálne CNL a ich schopnosti
Druhý typ riadených jazykov má gramatiku a slovník dostatočne presne špecifikované, aby texty mohli byť jednoznačne preložené do formálnych logických výrazov. To prináša nasledovné výhody:
- možnosť automatického overovania správnosti a konzistencie tvrdení;
- dotazovanie a vyhľadávanie informácií pomocou logických dotazov;
- automatické odvozovanie záverov (reasoning) a kontrola protichodných požiadaviek;
- integrácia s ontológiami a systémami reprezentácie znalostí.
Príklad jednoduchej vety v kontrolovanom angličtine, ktorá sa bez problémov mapuje do logiky: "Every employee who manages a project is responsible for that project." V CNL sa podobné vety formalizujú tak, aby nástroj mohol generovať zodpovedajúce logické pravidlá a overovať ich.
Aplikácie a nástroje
Riadené jazyky sa používajú v mnohých oblastiach:
- technická dokumentácia a návody (zníženie chýb pri používaní zariadení, lepší preklad do iných jazykov);
- tvorba a kontrola požiadaviek v softvérovom inžinierstve (jasné, jednoznačné požiadavky);
- legislatíva a zmluvy (zrozumiteľnosť a automatizovaná kontrola);
- znalostné bázy, chatboti a systémy otázok a odpovedí, kde je nutná spoľahlivá interpretácia vstupu;
- bezpečnostné a prevádzkové procedúry v letectve, vojenskom a priemyselnom prostredí.
Existujú nástroje na kontrolu súladu s pravidlami CNL (checkery), prekladače do formálneho zápisu, a editori so zabudovanou podporou slovníkov a pravidiel. Zavedenie takýchto nástrojov uľahčuje udržiavanie kvality textov a export do strojovo spracovateľných formátov.
Výhody a obmedzenia
Výhody:
- zvýšená presnosť a zrozumiteľnosť textov;
- jednoduchšia automatická analýza a spracovanie;
- lepší a lacnejší preklad dokumentov;
- možnosť overovania a automatizovaného odvodzovania záverov.
Obmedzenia:
- znížená vyjadrovacia bohatost – nie všetky nuansy prirodzeného jazyka sú zachovateľné;
- nutnosť udržiavať a spravovať slovníky a pravidlá, často v špecifickej doméne;
- pre niektorých autorov môže byť písanie v CNL menej prirodzené, vyžaduje školenie a prax;
- pri nesprávnej implementácii môže vzniknúť falošný dojem úplnej jednoznačnosti.
Odporúčané postupy pri zavádzaní CNL
- definovať jasné pravidlá a tvorcov slovníkov špecifických pre doménu;
- vyškoliť autorov a poskytovať im nástroje na kontrolu a automatickú spätnú väzbu;
- používať aktívny hlas, krátke vety a konzistentnú terminológiu;
- testovať mapovanie textov do formálnych reprezentácií a overovať ich použiteľnosť v cieľových systémoch.
Riadené prirodzené jazyky predstavujú praktický kompromis medzi ľudsky čitateľným textom a strojovou spracovateľnosťou. Správne navrhnuté a implementované CNL zlepšujú komunikáciu, znižujú chyby a otvárajú možnosti automatizovaného spracovania znalostí v rôznych odvetviach.