
Túljárt a világ legjobb 30 matematikusának eszén a mesterséges intelligencia
A kaliforniai gyűlésre a világ legjobb 30 matematikusa érkezett azzal a szándékkal, hogy összemérjék tudásukat egy úgynevezett „érvelő” chatbot ellen – ez a gép ugyanis képes a logikai következtetésekre és az összetett gondolkodásra. Két napon át professzionális szintű feladványokkal támadták a robotot, amelyről kiderült, hogy képes megoldani a világ legnehezebb, de még éppen megoldható matematikai problémáit.
A botot az o4‑mini hajtja – ez egy olyan különleges, érvelésre képes, nagy nyelvi modell (LLM), melyet az OpenAI tréningezett kifejezetten összetett logikai feladatokra. Hasonló képességekkel bír a Google Gemini 2.5 Flash is, de ez a könnyebb, gyorsabb modell azért kiemelkedő, mert jobban teljesít a matematikai problémák terén (nem úgy, mint a korábbi, hagyományos LLM-ek). A tudás felmérésére az OpenAI az Epoch AI nonprofit szervezetet bízta meg, akiknek tagjai 300 még nem publikált, bonyolult matematikai kérdést állítottak össze.
A matematikusok kiválogatták azokat a feladványokat, amiket ők még meg tudnak oldani, de az o4‑mini talán már nem – a cél természetesen az volt, hogy kifogjanak a mesterséges intelligencián. A találkozó vezetője azonban már a verseny elején meglepődött, hiszen az érvelő botnak tíz percen belül sikerült megoldania az egyik legnehezebb feladványt – derül ki a Live Science cikkéből. A gép először átnézte a kérdéshez kapcsolódó irodalmat, majd próbamegoldást készített, és a megoldásba is belevágott – végül tökéletes, gondolatmenettel alátámasztott választ adott. Az o4‑mini ráadásul hihetetlenül gyors volt – percek alatt oldotta meg azt, ami egy matematikusnak hetekig vagy hónapokig tartana. Az egyik matematikus így fogalmazott a gép teljesítményéről:
A résztvevőknek végül aztán sikerült 10 olyan feladványt találniuk, amelyek kifogtak az o4‑minin, de a teljesítmény így is elképesztő volt – olyannyira, hogy a matematikusok aggodalmukat fejezték ki. Az egyik résztvevő szerint a gép ugyanis már nem csak a logika erejével, de a megfélemlítés eszközével is dolgozik – a rendszer ugyanis túl magabiztosan prezentálta a válaszait.
A találkozó végén a résztvevők csoportja a matematikusok jövőjéről kezdett el gondolkodni, ugyanis mindannyiukat foglalkoztatta az a kérdés, hogy mi lesz, ha a gépek elérik az úgynevezett ötödik szintet – ahol már az emberi matematikusok is „megállnak”. Ha az AI eljut ide, a matematikusok szerepe radikálisan megváltozhat. Az egyik tudós így fogalmazott:
Olvasd el ezt is!