A mesterséges intelligencia, aki tanul a hibáiból

Egy új kutatás egyszerű ötletre épít: ha a mesterséges intelligencia nem csak a jó lépéseire emlékszik, hanem a rosszakra is, akkor legközelebb ügyesebben dolgozik. A ReasoningBank nevű módszer pont ezt csinálja, és így a gép gyorsabban, kevesebb próbálkozással old meg feladatokat. A tanulmányt egyetemi és ipari kutatók közösen készítették, és szeptember 29-én tették közzé az arXivon.

Az ötlet

Képzeljünk el egy okos füzetet, amibe a gép minden fontos tapasztalatát beleírja. Nem csak azt, ami sikerült, hanem azt is, ami nem sikerült. Ezekből a történetekből egyszerű, általános szabályokat készít: mit érdemes legközelebb kipróbálni, és mit kell elkerülni. Ezt a szabálygyűjteményt hívják ReasoningBanknak. Amikor új feladat jön, a gép belenéz a füzetbe, és az ott talált ötletek alapján dönt. A végén az új élményt is szépen visszaírja, így egyre okosabb lesz.

Több próbálkozás, gyorsabb tanulás

A kutatók egy másik trükköt is használnak, ezt MaTTS-nek (memory-aware test-time scaling) nevezik. Itt a gép ugyanarra a feladatra több különböző próbát tesz, mintha többször is nekifutna ugyanannak a kirakónak. Így több tapasztalat gyűlik össze, amiből jobb szabályok születnek a füzetben. A kettő együtt működik igazán jól: a jobb emlékezet ügyesebb próbálkozásokhoz vezet, az ügyesebb próbálkozások pedig még jobb emlékezetet adnak.

Mit mutatnak a számok

A módszert internetes navigációs feladatokon és kódhibák javításán próbálták ki. A kutatók arról számolnak be, hogy a ReasoningBank és a MaTTS együtt akár 34,2 százalékos relatív javulást hozott a sikerarányban, miközben átlagosan 16 százalékkal kevesebb lépésre volt szükség. Ez egyszerre jelent gyorsabb megoldást és alacsonyabb számítási költséget.

Miért fontos ez a pénzügyben

A bankoknál és a fintech cégeknél sok hasonló feladat ismétlődik: az ügyfélkérések megválaszolása, azonosítási adatok ellenőrzése, gyanús tranzakciók kiszűrése, űrlapok kitöltése. Ha a mesterséges intelligencia megjegyzi, hogy egy adatot hol érdemes ellenőrizni, milyen sorrendben célszerű lépni, és melyik út vezetett zsákutcába, akkor legközelebb gyorsabban segít. Kevesebb fölösleges kattintás, kevesebb tévedés, kevesebb várakozás az ügyfélnek.

Mire figyeljünk

Az okos füzet akkor hasznos, ha rendben tartjuk. Érdemes egyszerű, érthető szabályokat tárolni, megjelölni, milyen helyzetekben érvényesek, és időnként átnézni őket. Fontos az is, hogy a rendszer tudjon „felejteni”, ha egy szabály már nem működik, mert megváltozott egy weboldal vagy egy folyamat. Így az ügynök friss, megbízható tudásból dolgozik.

Forrás: Ouyang, Siru, et al. ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory, arXiv, 2025. szeptember 29.

Címlapkép: Depositphotos