GPT-4o: Új modellt jelentett be az OpenAI

További funkciók érkeztek a San Francisco-i OpenAI generatív AI megoldásához. A GPT-4o néven megjelenő frissítés immár a szöveg, a hang és a kép valamennyi kombinációját fel tudja dolgozni bemenetként, és ezek bármilyen kombinációját képes generálni is. A GPT-4o várhatóan ingyenesen is elérhetik majd a felhasználók.

O, mint omni

Az OpenAI május 13-án jelentette be, hogy új szintre lépett a ChatGPT a GPT-4o verzióval (az o az omni jelölése). A modellfrissítés mellett egy asztali appot is kiadnak, ami a felhasználói élmény javítását hivatott szolgálni a témában kiadott tájékoztatásuk szerint.

A fejlesztések célja a természetesebb kapcsolat kialakítása a felhasználók és a generatív mesterséges intelligencia között. Ehhez a legnagyobb újítás az, hogy a szöveges, a képi és a hang, információkat ugyanaz a neurális hálózat dolgozza fel. A hangbemenetekre például átlagosan 320 milliszekundum alatt képes reagálni, ami hasonló az emberi válaszidőhöz egy beszélgetés során.

Jelentős javulást mutat az új verzió a nem angol nyelvű szövegeknél is. Ez utóbbiak között a magyar nyelvet az OpenAI konkrétan nem nevezte meg honlapján, de számos más európai nyelvet igen.

Szélesebb körben elérhető modell

A GPT-4o funkciók a bejelentést követően fokozatosan élesednek majd, jelenleg még nem elérhetőek, de várhatóan hamarosan megérkeznek. A GPT-4o elérhető lesz az ingyenes felhasználók számára is, bár egyelőre nem teljesen világos, hogy pontosan milyen formában.

Az elkövetkező hetekben a ChatGPT Pluson belül a hang felismerés GPT-4o alapú új verzióját is bevezetik. A Plus felhasználóknál az üzenetkorlátozás szintjét is ötször magasabbra emelik annál, amit az OpenAI kínál.

A fejlesztők is elérhetik majd GPT-4o-t az API-ban, mint szöveg- és gépilátásmodellt. A GPT-4o kétszer olyan gyors lesz és fele annyiba kerül majd, mint a GPT-4 Turbo.

Új felhasználási területek

A természetesebb interakciók megkönnyítésével számos új felhasználási terület nyílik a szöveg, a hang és a képi információk integrálásával. Az OpenAI több videót és példát is megosztott. Egyebek mellett élő fordításra, matematika példák megoldására, nyelvtanulásra, állásinterjúra való felkészítésre, a környezet leírására (például vakok számára) és videók összefoglalására is használták a GPT-4o-t kollégáik.

(Forrás: OpenAI)