Operantné podmieňovanie: definícia, typy (posilnenie, trest, vyhasnutie)

Operantné podmieňovanie: stručná definícia a prehľad typov — pozitívne/negatívne posilnenie, trest a vyhasnutie s príkladmi a využitím v psychológii.

Autor: Leandro Alegsa

Operantné podmieňovanie (tiež nazývané operatívne podmieňovanie) je forma učenia, pri ktorej jedinec mení svoje správanie na základe dôsledkov (výsledkov) tohto správania. Človek alebo zviera sa postupne naučí, že určité činy vedú k nasledovaniu príjemných alebo nepríjemných následkov, čo ovplyvňuje pravdepodobnosť opakovania daného správania v budúcnosti.

V dôsledku operantného podmieňovania sa rozlišujú tri základné typy následkov:

  1. Posilnenie: pozitívna alebo odmeňujúca udalosť. To spôsobuje, že sa správanie vyskytuje častejšie.

    Príklad: dieťa dostane pochvalu za upratanie izby, pes dostane pamlsek za príchod na povel.

  2. Trest: negatívna alebo trestajúca udalosť. To spôsobuje, že sa správanie vyskytuje menej často.

    Príklad: pokuta za parkovanie na mieste pre imobilných znižuje pravdepodobnosť opätovného porušenia pravidla.

  3. Vyhasnutie: nenastane žiadna udalosť, takže správanie nemá žiadne následky. Keď správanie nemá žiadne dôsledky, vyskytuje sa menej často.

    Príklad: ak pes prestane dostávať pamlsky za určitý trik, časom už trik nebude vykonávať tak často.

Čo znamenajú pojmy „pozitívny“ a „negatívny“?

V kontexte operantného podmieňovania sa pojmy pozitívny a negatívny nepoužívajú v zmysle dobrý/špatný, ale technicky:

  • pozitívny = niečo sa pridáva (napr. odmena alebo nepríjemný stimul),
  • negatívny = niečo sa odoberá (napr. odstránenie nepríjemného podnetu alebo odobratie výhody).
  1. Pozitívne posilňovanie (často len "posilňovanie") nastáva, keď za určité správanie dostaneme odmenu. Tým sa zvýši frekvencia výskytu daného správania. V experimente so Skinnerovou škatuľou má odmena podobu potravy, keď potkan stlačí páku.

    Kľúčové je načasovanie a konzistentnosť odmeny – čím bezprostrednejší a spoľahlivejší je dôsledok, tým rýchlejšie sa správanie upevní.

  2. K negatívnemu posilneniu (niekedy "úniku") dochádza, keď sa odstráni averzívny podnet. Tým sa zvýši frekvencia výskytu daného správania. V experimente so Skinnerovou škatuľou bol hlasný zvuk, ktorý sa odstránil, keď potkan stlačil páku.

    Príklad: vodič si zapne bezpečnostný pás, aby prestalo pípať varovné svetlo – odstránenie nepríjemného zvuku posilňuje pripínanie pásu.

  3. Pozitívny trest nastáva vtedy, keď sa pridá stimul, ktorý vedie k tomu, že sa správanie vyskytuje menej často. Príkladom podnetu môže byť hlasný zvuk, elektrický šok (potkan) alebo výprask (dieťa).

    Pozor: tresty môžu mať vedľajšie účinky (strach, úzkosť, agrese) a často neučia alternatívne vhodné správanie.

  4. Negatívny trest nastáva vtedy, keď sa odoberie podnet, čo vedie k tomu, že sa správanie vyskytuje menej často. Príkladom môže byť odobratie hračky dieťaťu po tom, čo sa správa nežiaduco.

    Často sa tento prístup považuje za viac konštruktívny než pozitívny trest, ak je použitý rozumne (odvádzanie výhod za nevhodné správanie).

Mechanizmy a ďalšie pojmy

  • Akvizícia – prvotné učenie sa spojenia medzi správaním a jeho dôsledkom (napr. kde sa správanie zvýši v dôsledku posilňovania).
  • Vyhasínanie (extinkcia) – pokles frekvencie správania, keď dôsledok prestane prichádzať (napr. prestanú sa dávať odmeny).
  • Spontánne zotavenie – po období vyhasínania sa správanie môže objaviť dočasne znova bez ďalšieho posilnenia.
  • Generalizácia – šírenie naučeného správania na podobné podnety.
  • Diskriminácia – schopnosť rozlíšiť, v ktorých situáciách vedie správanie k dôsledku a v ktorých nie.
  • Shaping (tvarovanie) – postupné posilňovanie malých krokov smerom k zložitému správaniu.
  • Chaining (reťazenie) – spájanie viacerých jednoduchých reakcií do zložitejších sledov správania pomocou posilňovania medzi krokmi.

Scheduly posilňovania

Rôzne typy schedúl (stratégii) posilňovania vedú k odlišným vzorom správania:

  • Kontinuálne posilňovanie – odmena po každom výskyte správania (rýchla akvizícia, rýchle vyhasnutie).
  • Čiastočné (nepravidelné) posilňovanie – odmena len niekedy; má niekoľko variantov:
    • pevný pomer (FR) – odmena po presnom počte reakcií,
    • variabilný pomer (VR) – odmena po priemernom počte reakcií (veľmi odolné voči vyhasínaniu, napr. hazardné hry),
    • pevný interval (FI) – odmena za prvú reakciu po pevnom časovom intervale,
    • variabilný interval (VI) – odmena za prvú reakciu po variabilnom časovom intervale.

Aplikácie a obmedzenia

Operantné podmieňovanie má široké využitie v praxi: výchova a vzdelávanie (pozitívne posilňovanie, tokenové systémy), trénovanie zvierat (pamlsky, klikr-tréning), pracovné motivovanie (bonusy, hodnotenie výkonu), a behaviorálna terapia (napr. Aplikovaná behaviorálna analýza – ABA pri autizme).

Obmedzenia a etické upozornenia:

  • Trest môže potlačiť správanie, ale nezaručuje náuku vhodnej alternatívy a môže viesť k nežiaducim následkom (strach, vyhýbanie sa, agresia).
  • Odmeňovanie by malo byť primerané a konzistentné; nesprávne použitie posilňovania môže znížiť vnútornú motiváciu.
  • Pri práci s ľuďmi je dôležité zvážiť dôstojnosť, súhlas a dlhodobé dôsledky zásahov do správania.

Myšlienku operantného podmieňovania prvotne opísal Edward Thorndike (zákon účinku), systematicky ju analyzoval a experimentálne rozpracoval B. F. Skinner pomocou známych experimentov so Skinnerovou škatuľou. Operantné podmieňovanie sa líši od Pavlovovho klasického podmieňovania: operantné sa zaoberá dobrovoľnou modifikáciou správania dôsledkami, klasické podmieňovanie sa týka vytvárania reflexných reakcií na podmienené podnety (napr. Pavlovov pes reagujúci na zvonček).

Pre študentov a praktikov je užitočné poznať základné princípy (načasovanie dôsledku, konzistencia, vhodný typ posilnenia) a uvážlivo zvažovať, kedy je vhodné uprednostniť posilňovanie pred trestom, aby sa dosiahli dlhodobo stabilné a zdravé zmeny správania.

Thorndikeho zákon účinku

Operatívne podmieňovanie, niekedy nazývané inštrumentálne učenie, prvýkrát skúmal Edward L. Thorndike (1874-1949). Pozoroval správanie mačiek, ktoré sa snažili uniknúť z podomácky vyrobených skladačiek. Keď boli mačky prvýkrát umiestnené do krabíc, trvalo im dlho, kým unikli. S pribúdajúcimi skúsenosťami sa úspešné reakcie vyskytovali častejšie, čo mačkám umožnilo uniknúť za kratší čas. Vo svojom zákone účinku Thorndike teoreticky stanovil, že správanie, po ktorom nasledujú uspokojivé dôsledky, má tendenciu sa opakovať a správanie, ktoré vyvoláva nepríjemné dôsledky, má menšiu pravdepodobnosť opakovania. Stručne povedané, niektoré dôsledky správanie posilňovali a niektoré dôsledky správanie oslabovali. Thorndike týmto postupom vytvoril prvé známe krivky učenia.

B. F. Skinner (1904-1990) vypracoval podrobnejšiu analýzu operantného podmieňovania. Skinner vynašiel komoru na operantné podmieňovanie, ktorá mu umožnila merať rýchlosť reakcie ako kľúčovú závislú premennú. Používal záznam stlačení páky alebo páčenia klávesov.

Princípy operantného podmieňovania:

  1. Diskriminácia, generalizácia a význam kontextu.
    1. Učenie prebieha v súvislostiach.
    2. Väčšina správania je pod kontrolou podnetov: určitá reakcia sa objaví len vtedy, keď je prítomný vhodný podnet.
    3. Kontrola podnetov je účinná aj vtedy, ak podnet nemá pre respondenta žiadny význam.
  1. Extinkcia: operantné správanie zaniká, keď sa zastaví posilňovanie.
    1. K posilneniu dôjde až po správnej reakcii a nemusí dôjsť ani vtedy. Správanie sa z tohto dôvodu neoslabuje a nevyhasína.
    2. Výsledky čiastočne závisia od frekvencie posilňovania.
  1. Harmonogramy posilňovania: rozhodujúce je načasovanie posilňovania.
    1. Rozvrh s pevným intervalom: posilňovače sa predkladajú v pevne stanovených časových intervaloch za predpokladu, že sa uskutoční príslušná reakcia.
    2. Variabilný intervalový plán: správanie je posilňované na základe priemerného času, ktorý uplynul od posledného posilnenia. Pomerové rozvrhy: založené na pomere reakcií na posilnenie.
    3. Pevný intervalový plán: posilnenie sa dodáva po vykonaní určitého počtu reakcií. Osobitný prípad poskytovania posilnenia po každej odpovedi sa nazýva kontinuálne posilňovanie.
    4. Variabilný intervalový plán: posilňovanie dodávok je založené na určitom priemernom počte odpovedí.

Otázky a odpovede

Otázka: Čo je operatívne podmieňovanie?


Odpoveď: Operatívne podmieňovanie je forma učenia, pri ktorej jedinec mení svoje správanie v dôsledku dôsledkov (výsledkov) správania.

Otázka: Aké sú štyri súvislosti operantného podmieňovania?


Odpoveď: Štyri kontexty operantného podmieňovania sú pozitívne posilnenie, negatívne posilnenie, pozitívny trest a negatívny trest.

Otázka: Ako funguje pozitívne posilňovanie?


Odpoveď: K pozitívnemu posilneniu dochádza vtedy, keď za určitú formu správania existuje odmena, ktorá zvýši frekvenciu výskytu správania.

Otázka: Ako funguje negatívne posilňovanie?


Odpoveď: K negatívnemu posilneniu dochádza, keď sa odstráni averzívny podnet, čím sa zvýši frekvencia výskytu správania.

Otázka: Ako funguje pozitívny trest?


Odpoveď: Pozitívny trest nastáva, keď sa pridá stimul, ktorý vedie k tomu, že sa správanie vyskytuje menej často.
Otázka: Ako funguje negatívny trest? Odpoveď: K negatívnemu trestu dochádza vtedy, keď sa odoberie podnet, čo vedie k tomu, že sa správanie vyskytuje menej často.

Otázka: Kto prvý objavil operantné podmieňovanie?


Odpoveď: Edward Thorndike ako prvý objavil operatívne podmieňovanie a neskôr ho analyzoval B. F. Skinner.


Prehľadať
AlegsaOnline.com - 2020 / 2025 - License CC3