Mesterségem: mesterséges neuropszichológus. Gépterapeuta kerestetik 😊
Korábban már tréfálkoztam azzal, hogy hamarosan kialakulnak új szakmák/tudományágak, azzal a céllal, hogy az AI rendszereket hatékonyabban taníthassuk (A-pedagógus), működésüket finomíthassuk (A-pszichológus), megérthessük (A-idegtudós).
A tréfából úgy tűnik kezd valóság lenni, három szálon is.
Az első szál: A minap küldött nekem valaki egy a szűk közelmúltban (2023 09 04) az arXiv szerverre feltöltött cikket , mely arról szól, hogy a Nagy Nyelvi Modellek (Large Language Models, továbbiakban LLM, legismertebb képviselőjük a ChatGPT) úgy tűnik mutatják a Theory of Mind (ToM) jelenségét (mi is ez, lásd alant). A kutatók annak próbáltak utána járni ezt hogyan teszik. Ehhez az emberi agyban megfigyelt idegsejtmintázatok elemzési módszereit használták és meglepő hasonlóságokat találtak a prefrontális kéregben megfigyelt sejtaktivitás mintázatokkal.
Mielőtt túl messzire szaladna az olvasók gondolata. Nem az AI tudatát találták meg és a hasonlóság is bonyolult matematikai hasonlóság. De, számomra ez a cikk egy új tudományág első cikke (nyilván van korábbi is, de nagy a világ, eddig ilyennel nem találkoztam). Azé a tudományágé, amely szemmel láthatólag azzal fog foglalkozni, hogy mi történik egy mesterséges neuronhálózatban, hívjuk Mesterséges Neuropszichológia-nak (ANP).
A Theory of Mind (ToM) amúgy azt jelenti, hogy az ember (vagy más fejlett tudatú állat csimpánz, makákó, papagáj, varjú) képes annak megértésére, hogy egy másik ember nem ugyanazt tudja, amit Ő, és gondolkodása során képes más helyébe képzelnie magát, más fejével gondolkodni, másnak elmét feltételezni. Az agy evolúciójával foglalkozó szakemberek szerint ez egy nagyon fontos lépés volt a modern emberi gondolkodás kialakulásában. Evolúciós hajtóereje ugye az, hogy ha tudom rólad, hogy te tudod, hogy a Rezső hova dugta a csokiját, akkor ebből a tényből sok előnyt kovácsolhatok. Azaz aki képes volt ezekre az átvitt érvelésekre hatékonyabban élt túl és több utódja lett. A ToM azért fontos, mert ennek kapcsán kialakult agyunkban a gondolatok egymásba láncolásának, az érvelésnek és feltételes gondolkodásnak a lehetősége.
A második szál: Az OpenAI fejlesztőinek megfelelő rábeszéléssel sikerült jelentősen javítani a ChatGPT 4 matematikai képességeit. Eddig, ha valaki megkérdezte tőle, hogy mennyi 12+7, akkor vagy mentegetődzött, hogy: „Én csak egy egyszerű nyelvi modell vagyok, ilyet nem tudok” vagy butaságot válaszolt a maga rezzenéstelen konfabuláló módján. Lépésenként -mint egy jó matematika tanárnak- sikerült rávezetni az LLMet, hogy mi is az a számolás és hogyan működik. Ezek után már helyesen tudott válaszolni a kérdések nagy részére, azaz tudott számolni. A dolognak egy kisebb és egy nagyobb jelentősége van. A kisebb az, hogy megfelelő felvezetéssel a ChatGPT tud számolni. A nagyobb az az, hogy itt nem történt teljesen új tanulás, mindössze a megfelelő kontextusban tették fel a kérdést. Azaz ki tudja még milyen egyéb dolgokat lehet belőle kibányászni, ha megfelelően kérdezünk. Kicsit olyan, mint amikor a pszichoanalista díványon az ügyes pszichiáter rá tudja venni páciensét a gyógyulásra jó rávezető kérdésekkel. Vagy amikor hipnózis alatt a pszichológus hozzáfér eddig elzárt dolgokhoz. Vagy az ügyes tanár rávezeti a diákot a helyes megoldásra. E-pszichiáter, E-pszichológus, E-tanár van kialakulóban. Történetesen már neve is van ennek a szakmának: „prompt engineer”. A prompt a számítógép parancssora, amibe a parancsokat kell írni. A „prompt engineer” feladat, hogy rájöjjön milyen módon lehet rávenni az LLM-et a helyes megoldásra.
A harmadik szál: Egy másik prompt engineer-i győzelem.
"I want you to act as a rival chess player. I We will say our moves in reciprocal order. In the beginning I will be white. Also please don't explain your moves to me because we are rivals. After my first message i will just write my move. Don't forget to update the state of the board in your mind as we make moves. My first move is e4."
Kiderült a ChatGPT-ről, hogy sakkozni is tud, ráadásul nem is rosszul, 1600 Élő pontja van. Ez egy nagyon fontos érv volt abban a vitában, hogy vajon az LLM-ek csak ügyes, véletlenül kombináló papagájok vagy képesek kreativitásra.
A ChatGPT tudása a számolásról és a sakkról onnan ered, hogy a több Tbyte-nyi szöveg, amin tanították rengeteg számolást és sakkjátszma leírást is tartalmazott. De az a tény, hogy korábban nem lejátszott sakkjátszmákban is jól teljesít arra utal, hogy vannak „önálló gondolatai”, képes újat létrehozni, nem csak a korábbiakat szajkózza vissza hatalmas adattárából.
No de megkérdezheti az Olvasó: Miért van szükség arra, hogy ilyen kacifántos módon vegyük rá LLM-ünket arra, amit szeretnénk és ilyen nehezen bányásszuk ki, hogy hogyan is működik?
Hát ennek sok oka van. Az egyik az, hogy alapjában véve senki nem tudja hogyan működnek a deep learning (DL) hálózatok. Az ezeket programozók azt mondják ez kicsit, woodoo, kicsit szakácsművészet. Pakoljuk egymásra a rétegeket és kötögetjük őket egymáshoz, csavargatjuk a paramétereket (tanítás formájában). Aztán kellő idomítás után egyszer csak elkezdik megoldani a feladatokat. Egy DL hálózat nem olyan, mint egy robbanó motor, ahol tudjuk melyik alkatrész mit csinál: ez itt a porlasztó, ami robbanóelegyet csinál, ez itt a gyújtógyertya, ami azt berobbantja, hogy a dugattyú mozgássá alakíthassa a kitáguló meleg gáz energiáját…. A mérnökök manapság nem terveznek, hanem tanítanak.
Ez persze nem lepett meg senkit, hiszen a DL a mesterséges intelligencia neuronális reprezentáció ágán alakult ki, mely egy konnekcionista elmélet. A konnekcionizmusról és egyik ágáról a PDP-ről (Parallel Distributed Processing, Párhuzamos Elosztott Feldolgozás) a későbbiekben még sokat fogok írni, mert állításainak ismerete fontos az agyműködés megértéséhez. Röviden: a PDP azt állítja, hogy egy neuronhálózatban vannak csomópontok és kapcsolatok (gráf élek). A csomópontok állapotának mintázata jelenti, kódolja, reprezentálja az aktuális állapotot. A kapcsolatok erőssége pedig a rendszer tudását hordozza. A hálózat információ feldolgozása pedig az, hogy az aktuálisan működő csomópontok kapcsolataikon keresztül mely csomópontokat fognak aktiválni. Azt, hogy a hálózat aktivitása hová fejlődik (milyen mintázatú lesz) függ attól mi volt a kiindulási mintázat (jelen) és mik a kapcsolati erősségek (tudás, memória, múlt).
Egy ilyen rendszerben nem lehet rámutatni, hogy melyik csomópont (elem, neuron) jelent egy dolgot, hiszen a csomópontok (neuronok) csoportjainak aktivitása jelent valamit. És arra se lehet rámutatni melyik kapcsolatban található a tudás, hiszen pl. az N sejt közötti N*N lehetséges kapcsolatban raktározódik a tudás. Ezért hívják „distributed”-elosztottnak a neuronhálókat. „Parallelnek”-párhuzamosnak pedig azért, mert a kezdő csomópontok aktivitása a kapcsolatokon egyszerre, párhuzamosan-szalad végig és váltja ki a következő aktivitásmintát.
Ebből fakad tehát, hogy a DL megoldásoknál nem lehet rákérdezni arra, hogyan oldotta meg és nem lehet beprogramozni hogyan kell megoldani. Vizsgálgatni és tanítani kell. Ahogy a depressziósnak vagy az ADHDs-nak sem segít az, ha elmagyarázzák neki, hogy mi a baja, hanem hosszas, gyakorlati kognitív terápiára van szüksége, a DL hálózatokba se tudjuk beprogramozni a Newton törvényeket, hogy azokat rögtön használják.
Olvastathatunk cikkeket velük a fizikáról és rávezethetjük hogyan kell használni. Ehhez kellenek majd az E-szakemberek a prompt engineer-ek.
A tréfát tovább folytatva: lehet, hogy a „prompt engineer”-eket nem a humán pszichében közismerten járatlan, nerd, geek, kocka, programozókból kelllene toborozni, hanem a pszichológusok közül 😊
Szerző: Gulyás Attila