A tanulás típusai

2025. július 18. péntek

A tanulás alapja a szinaptikus súlyok megváltozása. A neuronhálózatoknál bemutattuk a memória alapjául szolgáló sejtszintű, társításos (asszociatív) tanulást, mely a Hebb szabályt használva alakítja a szinaptikus súlyokat, és ezért a hálózat információfeldolgozó képességét. Ez ugye a (kis)hálózat szintű tanulást írja le, ami azonnali és mindig bekövekezik, ha megvan az egyidejűség.

Mint a felvezetőben láttuk nem kell azonban mindent megtanulni, hanem csak bizonyos dolgokat, aminek eldöntéséhez és végrehajtásához egy összetett, egész agyat átölelő rendszer kell. Ezenkívül az agyi tanulás egy többlépcsős folyamat: különböző típusú emléknyomok keletkeznek különböző feldolgozást végző agyi hálózatokban. Az egyszerű, szinte reflexes tanulástól, a kondicionálástól az összetett problémamegoldásig az agy különböző tanulási módszereket és rendszereket alkalmaz.

Itt most a következő szinten, az agy szintjén járjuk körbe a tanulás típusait és mechanizmusait. Igazodjunk az elme működését vagy az állatok viselkedését vizsgáló pszichológusokhoz, akik számos módon csoportosították a tanulások fajtáit.A felügyelet nélküli és a felügyelt tanulás különbségei. Ezek agyhálózat szintjén erősen átfednek a nem asszociatív és asszociatív, jutalmazásos tanulással.

Az első megkülönböztetés, hogy vajon a tanulás asszociatív vagy nem-asszociatív, azaz társításos vagy társítás nélküli-e.

 

Kezdjük a társítás-nélküli tanulással. Az egyszerűbb, a legősibb tanulási forma, amelyben nincs kapcsolat két inger vagy inger és válasz között. Azaz nincs megerősítés, működéséhez nem szükséges jutalom vagy büntetés, felügyelet nélkül is működik. A szervezet egyszerűen a környezeti inger ismétlődésének hatására módosítja viselkedését. Ez a típusú tanulás kishálózatokon belül történik, nem szükségesek hozzá a nagy agyi tanuló rendszerek. A társítás nélküli tanulás egyszerű idegrendszerekben is megfigyelhetők (pl. örvényféreg, tengeri csiga, muslinca).

Fő típusai:
-Habituáció (megszokás): az inger ismétlődése csökkenti a válasz erősségét (pl. nem veszed észre a háttérzajt egy idő után). Ez akkor hasznos amikor az inger nem okoz se, jót se rosszat, érdemes figyelmen kívül hagyni, hogy agyunk a lényeges dolgokra tudjon figyelni.
-Szenzitizáció (érzékenyedés): az inger ismétlődése fokozza a válasz erősségét (pl. fájdalmas ingerre nő az érzékenység). Ugye itt egy jó vagy rossz hatású ingerre kezdünk alaposabban odafigyelni.
-A kódolás-reprezentáció kialakulása, a hálózatok betanulása:- Ide tartozik igazából az a tanulás, ami a fejlődő érző kérgekben történik, miközben kialakulnak a sejtek receptív mezői (lásd a Kismacska meséjét), a különböző szintű reprezentációk. Kicsit zavaró lehet, hogy ezt is a társítás nélküli tanuláshoz tesszük, pedig az asszociatív, azaz társításos Hebb szabályt alkalmazza. De azt sejt szinten, nem pedig az agyterületek között (nincs inger-válasz kiértékelés). A kishálózatok sejtjeinek szintjén társítás történik, de egy szinttel feljebb, az agyterületek között  nem.

 

A tanulás fajtái. A társításos tanulást többféle képpen is fel lehet osztani. Lásd a jobboldal három sorát. A bal és a jobb oszlopban található tanulási felosztások jelentős, de nem teljes átfedést mutatnak (erre utal az elmosódott, a tanulásokat magába foglaló ellipszis). A nem átfedő esetekre a példákat lásd a szövegben. A sárga dobozok az két fő kategória tulajdonságait mutatják.

Az asszociatív, társításos tanulás jóval sokszínűbb és többre képes. Itt kapcsolat alakul ki két inger, vagy egy inger és egy válasz között. Az érző agyterületek és a mozgató/tervező agyterületek közötti kapcsolatok módosulnak, a tanulás gyakran jutalomhoz vagy büntetéshez kötött, azaz felügyelt tanulás. Meghatározó a jutalmazásban résztvevő dopaminerg rendszer a siker vagy kudarc jelzésében. 

Többféle, részben egymással átfedő módon osztják fel az asszociatív, megerősítéses tanulást.

 

Elsőként felosztják explicit és implicit tanulásra: Tudatosul-e a tanult információ? Tudatos-e a tudás vagy a tanulás?

 

Implicit tanulás: Nem tudatos, automatikus a tanulás, a személy nem tudja megfogalmazni, mit tanult. Pl. séta közben tanulod meg az útvonalat, vagy a kisgyerek beszéd közben kezdi el használni a nyelvtani szabályokat, anélkül, hogy meg tudná őket nevezni. Ide tartozik az érzékelés- (percepciós, pl. mintázatok felismerése), mozgás- (pl. biciklizés) vagy szokások (pl. zsebre tesszük a kulcsot induláskor) tanulása.


Explicit tanulás: Tudatos, szándékos tanulás: „Most megtanulom, hogy ha A történik, akkor B következik.” Jellemző a hippokampusz-függő epizodikus és deklaratív memóriában. Szóban kifejezhető, kontrollálható. El tudom mesélni mit tanultam.

 

Az implicit (készség, bal) és explicit (tények, jobb) tanulás máshogy, más rendszerekben történik.Annak az alapján is meg lehet különböztetni eltérő tanulási formákat (modell független/modell alapú) hogy csak ingert társítunk válasszal vagy egy belső modellt használunk és ezzel vetjük össze a kimenetelt.

Model-független tanulás: olyan tanulás, amely csak a múltbeli jutalmak és hibák alapján alakítja a viselkedést, nincs mentális modell a környezetről. „Ha A, akkor nyereményt kaptam, tehát ismétlem A-t.” Szokásalapú, gyors, de kevéssé rugalmas. Elsősorban a törzsdúc rendszerben (striátum) történik ez a típusú tanulás.

Modellen alapuló tanulás: Az agy belső reprezentációt (modellt) épít a környezet struktúrájáról (pl. mi következik miből) és következtet a jövőbeli következményekre. Következményeket mérlegel, előrelátó, célorientált. „Ha ezt csinálom, akkor az fog történni. Próbáljuk meg!” Lassabb, de alkalmazkadó és rugalmas. Elsősorban a homloklebeny és a hippokampus vesz részt benne. 

A mindennapi életben a két tanulási mód együttműködik: az egyik rugalmas és adaptív a másik gyors és energiatakarékos. Gyakran először modellen alapulva, tudatosan tanulunk, aztán egy idő után a helyes megoldások rögzülnek modell-független, automatikus módon. Lásd amikor a munkábajárás metróval vagy a gépírás egy idő után készséggé válik. „Lemegy gerincvelőbe”, mondják, de igazából pontosabban a striátumba megy le. A tudatos feldolgozás sokkal több agymunkát és ezáltal energiát igényel. Az evolúció takarékos, ha már tudunk valamit, azt agyunk átteszi a modell-független rendszerbe, így gazdaságosabb használni.

A modell-független / modell-alapú és az explicit / implicit tanulás két eltérő dimenzióját írja le a tanulásnak, erős az átfedés köztük, de vannak nem átfedő esetek is.
Azaz a modell-független rendszer legtöbbször implicit, de lehet explicit is (pl. amikor valaki megtanul egy sémát, de nem épít modellt). A modell-alapú rendszer legtöbbször explicit, de lehet implicit is, ha pl. a belső modell nem tudatosul (pl. összetett környezeti megoldások a viselkedésben, de nem tudjuk megfoglmazni miért úgy teszünk, ahogy, bevált).

A lehetőségek:
Model-free & implicit    Reflexes, szokásalapú, gyors    Leggyakoribb (pl. szokások, addikciók). A striátum vesz benne részt.
Model-based & explicit    Rugalmas, célorientált, tudatos    Problémamegoldás, döntéshozás. A homloklebeny és a hippokampusz vesz benne részt.
Model-based & implicit    Tapasztalati modellalkotás tudatos verbalizáció nélkül    Ritkább, rejtett stratégiai tanulás.
Model-free & explicit    Rituálészerű tanulás, szabály ismétlése modell nélkül    Lehetséges, de ritkább.

De, hogy a dolog még bonyolultabb legyen csoportosítják úgy is a tanulást, hogy a tanulás egy ingerre adott válasz vagy egy akcióra adott válasz után következik-e be?

Stimulus-outcome és az action-outcome tanulás:

 

A tanulás mechanizmusainak két kutatója, Pavlov és Skinner. A klasszikus és az operáns kondícionálás tanulási modellek kidolgozói.Stimulus–Outcome (inger - válasz) tanulás: Gyakran passzív, nincs szükség döntésre vagy cselekvésre. A tanulás automatikusan bekövetkezik az inger és a jutalom társításával. A szervezet nem számolja ki, „mi lenne, ha” – egyszerűen megtanulja, hogy az adott ingerhez kellemes vagy kellemetlen következmény tartozik. Ez hasonlít a model-free/ implicit tanulásra, ahol értékalapú tanulás történik, nem szabályszerűségek alapján. Ez felel meg leginkább a klasszikus kondícionálásnak, Pavlovi tanulás, hiszen itt is egy ingert társítanak egy válaszhoz.

Action–Outcome (cselekvés - válasz) tanulás: A szervezet megtanulja, mely cselekvés vezet egy adott kimenetelhez. Ehhez gyakran szükség van arra, hogy a szervezet elképzelje: „ha most ezt csinálom, akkor X fog történni”. Ez már mentális modell használatát igényli, és ezért közel áll a model-based/explicit  tanuláshoz. Ilyenkor a jövőbeli következményeket mérlegelve történik a választá. Ez az operáns kondícionálás (Skinneri vagy instrumentális tanulás) kezdeti szakaszáva egyezik meg, hiszen itt egy tev, egy cselekedet erősödik meg, ha jutalmat kapott rá az állat. A tanulás végére, amikor aztán már sokat gyakorolta és automatikussá válik, akkor már igazában inger-válasz reakcióvá válik.

 

A kétfajta tanulás eltárő dolgokat társít. A Pavlovi, egy ingert társít egy cselekedethez, a Skinneri egy viselkedést rögzít jutalmazással.

Az utóbbi felosztás részben megfeleltethető a korábbiaknak, de nem teljesen, mert létezik 4 kombináció. A Stimulus–Outcome tanulás megjelenhet model-based/explicit rendszerben is, ha az inger a mentális modell része (pl. kontextus vagy helyzet mint input). Ugyanakkor az Action–Outcome tanulás lehet model-free is, ha a szervezet csak szokásalapúan választ, anélkül, hogy újraértékelné az összefüggéseket (pl. „eddig ez működött, most is ezt csinálom”).

Ami fontos, hogy a 4 kombináció más agyi rendszereket használ:
modell-független: Dorsolaterális striatum, dopaminerg projekciók. Automatizált értéktanulás, Klasszikus: szokások, motoros készségek, (ritka, de lehet pl. szabály memorizálása). 
model-alapú: Dorsomediális striatum, prefrontális kéreg (PFC), orbitofrontális kéreg, hippokampusz. Tervezés, következmények értékelése. 
inger–válasz tanulás: Amigdala, orbitofrontális kéreg, ventrális striatum. Asszociációtanulás
cselekvés–válasz tanulás: Dorsomediális striatum, prefrontális kéreg (PFC). Döntésorientált tanulás

A különböző tanulásokban résztvevő agyi rendszerek.

A tanulási típusokat összevethetjük a fentebb tárgyalt memória típusokkal is. Az implicit/modell-free/inger-választ tanulás leginkább a procedurális memóriába kerül, míg az explicit/model-based/akció-válasz leginkább a szemantikus memóriába. 

A tanulási módok után folytassuk a jutalmazási rendszer leírásával.

Szerző: Gulyás Attila

Korábbi hozzászólások
Még nincsenek hozzászólások
Új hozzászólás
A hozzászólások moderáltak, csak az Admin jóváhagyása után jelennek meg!