Hogyan villog az egér feje amikor jutalmat vagy büntetést kap? A tanulás megerősítésének agyi folyamatai.
Az agynak számos feladatot kell végeznie: választ adni, emlékezni, tanulni, ezekhez mind kicsit más feldolgozási módokba kell kapcsolnia. Mi is átrendezzük az íróasztalunkat vagy más szerszámokat veszünk elő, amikor egy másik feladat megoldására készülünk. Mint majd beszélünk róla az idegsejteknél a feladatmegosztás az, hogy a serkentő sejtek végzik az információ feldolgozását és a tanulást, a kisebbségben levő gátlósejtek pedig egyrészt biztosítják az agy biztonságos működését, másrészt szabályozzák azt, hogy az agy éppen milyen működési módban legyen. Ők a rendőrök és a rendeleteket hozó minisztériumi dolgozók, akik az agy társadalmának működését szabályozzák.
Az emberi agy azért tud igen hatékonyan tanulni (lásd Dehaene könyv), mert amikor egy próbálkozásra megérkezik a visszajelzés, a jutalom egy nagy csoki formájában vagy a büntetés egy vödör hideg víz formájában, akkor agyunk azon kiértékelő rendszerei, melyek eldöntik, hogy most éppen jó vagy rossz történt velünk visszajelzést küldenek az agy tervező részeinek, hogy amit épp az előbb csinált az jó volt, kapcsoljon feldolgozó módból raktározó vagy felejtő módba. Ismételni kell, vagy nehogy még egyszer az életben próbálkozzanak ilyennel. Ezt hívják megerősítéses tanulásnak (reinforcement learning).
Szadai Zoltán és munkatársai, a Rózsa Balázs által vezetett Neuronhálózat és Dentritikus Aktivitás Kutatócsoportban, azt vizsgálták, hogy az egér agyába ezek az információk hogyan jutnak el (a szerzőkkel készült riportot itt olvashatjátok). Korábbi eredmények azt sugallták, hogy a gátlósejtek egy csoportja, a VIP sejtek, fontosak ebben a folyamatban. A VIP itt nem azt jelenti, hogy nagyon fontos személyiségek ezek a sejtek, hanem hogy ezt a gátlósejttípust a benne előforduló VIP rövidítésű (vasoactive intestinal polypeptide) fehérje előfordulása alapján lehet azonosítani (azt még nem tudjuk mi a szerepe, de jelölőanyagnak kiváló). Optogenetikai módszerek használatával megoldható, hogy ezek a sejtek kifejezzék a GCaMP nevezetű fehérjét és így aktivitásuk mérhető legyen. A VIP sejtek egyedi tulajdonsága, hogy más gátlósejtek aktivitását gátolják. Mivel egyetlen VIP sejt több száz gátlósejtet idegez be, akik egyenként több száz serkentő sejt aktivitását szabályozzák ezért, ha egy VIP sejt működésbe lép gátolja a gátlást több tízezer serkentő sejten. A gátlás gátlása ezért egy közvetett serkentés, úgy nevezik disz-inhibíció. Tehát ezek a sejtek kulcsfontosságú szerepet töltenek be az agykérgi serkentő sejtek aktivitásának szabályozásában.
A csoportnak az ELife folyóiratban megjelent munkája azt vizsgálta, hogy az egér hallókérgében egy tanulási feladat során mi történik a különböző esetekben. A rögzített fejű állat a virtuális labirintusban azt a feladatot kapta, hogy ha egy alacsony hangot hall akkor ihat, ha magasat akkor nem ihat. Ugye 4 lehetséges eset áll itt fent. Ha az alacsony hang után nyalakodik akkor megkapja a jutalom italt, ha ilyenkor nem nyal, akkor nem történik semmi. Ha a magas hangra nem nyal szintén nem történik semmi, de ha ekkor próbál meg nyalni akkor kellemetlen ingerrel (levegő puffantás az arcra) jelzik, hogy rosszul válaszolt. Mind a jutalom, mind a büntetés fontos a tanulás szempontjából. Az állat alacsonyabb rendű agyterületei kiértékelik, hogy a válasz után jó, rossz vagy semmi se történt és ezt az információt eljuttatják majdnem az egész agykéregbe, többek között a hallókéregbe is, hogy az adott agyterület el tudja dönteni érdemes-e megtanulni, amit nemrég „javasolt” vagy inkább el kell kerülni. Hogy ez a jeltovábbítás hogyan történik még nem teljesen ismert.
A kutatók a kísérletekben azt találták, hogy a VIP sejtek valószínűleg részt vesznek ebben a kiértékelő folyamatban, mivel a 4 lehetséges kísérleti kimenet esetén jellegzetesen máshogy működtek. Az agykéreg majd minden területén a legerősebb reakciót akkor mutatták, amikor az állat a hibás nyalakodás miatt büntetést kapott. Akkor is aktiválódtak, igaz kicsit gyengébben, amikor az állat a helyes válaszért jutalmat kapott. A közömbös esetekben nem mutattak változást. Tehát aktivitásuk azt jelezheti a rendszer számára, hogy valamit változtatni kell, de azt nem jelzi nagyon jól, hogy melyik irányba. Azt is megfigyelték, hogy a sejtek erősebben válaszolnak amikor az állat figyelmi szintje magasabb (ezt a kitáguló pupillák jelzik), illetve amikor mozgásban van. A látókérget megfigyelve azt tapasztalták, hogy a VIP sejtek mind látási ingerre, mind a tanításhoz használt hangingerre aktiválódnak, azaz a feladatban aktuálisan éppen nem fontos agykérgi területre is eljut a kiértékelő információ. Nyilván ennek oka az, hogy amikor az állat csinál valamit nem tudhatja melyik érzékszerve fogja a megerősítő ingert szolgáltatni. Ebből persze az is fakad, hogy több társításra van szükség a tanuláshoz, hiszen lehet, hogy míg a hanginger minden alkalommal összefügg a kimenetellel, addig a látóinger véletlen szerű. Egyetlen tanulás alkalmával a véletlen is rögzülne, az emberi kultúrában ezt hívják babonának😊.
A minisorozat következő bejegyzése a csoport egy másik cikkét mutatja be, mely szintén az összefüggés-kereső agy trükkjeit vizsgálja.
Szerző: Gulyás Attila