Gondolkodó AI modellt mutatott be az OpenAI

Az OpenAI új mesterséges intelligencia (AI) modell sorozat bevezetését jelentette be. Az o1 névre hallgató modellt már ki is próbálhatják az előfizetők. A hír jelentősége, hogy az o1 már képes saját döntéseinek felülvizsgálatára mielőtt választ adna a felhasználók kérdéseire.

Futószalagon érkeznek az új modellek

Az OpenAI legutóbb májusban mutatta be legújabb nagynyelvi modelljét (Large Language Model – LLM) a GPT-4o-t, aminek júliusban kissé leegyszerűsített, de rendkívül költség hatékony verzióját a GPT-4o minit. A most bevezetett modellt már júliusban belengették, akkor még ‘Strawberry‘ név alatt. Az o1 még tesztelés alatt áll, de a ChatGPT előfizetéssel rendelkező felhasználók már kipróbálhatják.

Miért Strawberry?

A ‘Strawberry’ elnevezés nem véletlen. Az elnevezés a nagy nyelvi modellek egyik triviálisnak tűnő, de fontos problémájára hivatkozik. Ugyanis, ha megkérdezzünk egy nagy nyelvi modellt, hogy hány ‘r’ betű van a ‘strawberry’ szóban nagy valószínűséggel nem fogja eltalálni, hogy három.

Erre az egyszerű kérdésre azért válaszol helytelenül az AI, mert nem betűkre lebontva dolgozza fel a szöveget, mint egy ember. A nagy nyelvi modellek úgynevezett tokeneket használnak a szöveg legkisebb egységeként, amik több betűt vagy akár egész szavakat is tartalmazhatnak.

Ez az alapvetően hatékony megközelítés bizonyos esetekben nem várt rossz válaszokhoz vezethet. A rossz válaszokon kívűl a nagy nyelvi modellekkel való kommunikációt is meg tudja nehezíteni, hiszen más logika mentén gondolkodik a felhasználó és a modell.

Sam Altman, az OpenAI ügyvezetőjének rejtélyes bejegyzése az X-en, még augsztusban

Miért jelenthet újabb áttörést az o1?

Az o1 modell lényege, hogy hasonlóan az emberi gondolkodáshoz, több időt töltenek egy-egy kérdés megválaszolásával. Ez a gondolkodási idő lehetővé teszi, hogy hatékonyabban oldjanak meg összetett kérdéseket. Ezzel nem csak a strawberry problémát oldja meg jobban, de jobban teljesít a matematika, a természettudományok és a programozás terén is.

Az eddigi tesztek azt mutatják, hogy az új modell fizikában, kémiában és biológiában olyan teljesítményt nyújt, mint a PhD hallgatók. Matematikában és kódolásban is kimagasló eredményeket ért el. Például a Nemzetközi Matematikai Diákolimpia előválogatóján adott feladatokat 83%-os pontossággal oldotta meg, szemben a GPT-4 modell 13%-ával. Az új modell az említett területeken dolgozók munkáját gyorsíthatja fel elsősorban.

OpenAI a fintechben

Az új modell kódolási képességeivel a technológiai szektorban is új felhasználási területek nyílhatnak. Az eddigiek alapján valószínűtlennek tűnik, hogy fejlesztőket tud majd helyettesíteni, azonban egyre valószínűbbnek látszik, hogy érdemben segíti majd munkájukat. A fintech cégek ebből is profitálhatnak. Amennyiben ki tudják használni az LLM-ek nyújtotta lehetőségeket gyorsabban léphetnek piacra termékeikkel és költségeket takaríthatnak meg.

A legnagyobb fintechek közül a Klarna élen jár az AI technológiák kihasználásban. Az OpenAi-al közösen fejlesztett chatbotjuk segítségével a BNPL cég várhatóan 40 millió dollárt spórol meg 2024-ben. A Klarna ügyvezetője szerint pedig a cég munkavállalóinak felét le tudja majd váltani a mesterséges intelligencia.

Az OpenAI emellett gyorsan növekszik. Az LLM-ek vállalatoknak történő értékesítése és a ChatGPT előfizetésekből származó bevétel az egy évvel ezelőttihez képest megháromszorozódott, ami havi 283 millió dollár jelent. Arról nincs információ, hogy mekkora költségek mellett, de ezek feltehetően magasabbak a bevételeknél. A vállalat értékelése pedig 86 milliárd dollár.

(Forrás: OpenAI)
(Címlapkép: OpenAI)