Túljárt a világ legjobb 30 matematikusának eszén a mesterséges intelligencia

Titkos találkozó zajlott nemrég Kaliforniában, ahol a világ vezető matematikusai gyűltek össze, hogy teszteljék a mesterséges intelligencia tudását – a résztvevők döbbenten álltak a tény előtt, hogy egy gép milyen hatékonyan és gyorsan végzi el a munkájukat.

A kaliforniai gyűlésre a világ legjobb 30 matematikusa érkezett azzal a szándékkal, hogy összemérjék tudásukat egy úgynevezett „érvelő” chatbot ellen – ez a gép ugyanis képes a logikai következtetésekre és az összetett gondolkodásra. Két napon át professzionális szintű feladványokkal támadták a robotot, amelyről kiderült, hogy képes megoldani a világ legnehezebb, de még éppen megoldható matematikai problémáit.

A botot az o4‑mini hajtja – ez egy olyan különleges, érvelésre képes, nagy nyelvi modell (LLM), melyet az OpenAI tréningezett kifejezetten összetett logikai feladatokra. Hasonló képességekkel bír a Google Gemini 2.5 Flash is, de ez a könnyebb, gyorsabb modell azért kiemelkedő, mert jobban teljesít a matematikai problémák terén (nem úgy, mint a korábbi, hagyományos LLM-ek). A tudás felmérésére az OpenAI az Epoch AI nonprofit szervezetet bízta meg, akiknek tagjai 300 még nem publikált, bonyolult matematikai kérdést állítottak össze.

A bejegyzés megtekintése az Instagramon

Evolving AI (@evolving.ai) által megosztott bejegyzés

A kihívás menete

A matematikusok kiválogatták azokat a feladványokat, amiket ők még meg tudnak oldani, de az o4‑mini talán már nem – a cél természetesen az volt, hogy kifogjanak a mesterséges intelligencián. A találkozó vezetője azonban már a verseny elején meglepődött, hiszen az érvelő botnak tíz percen belül sikerült megoldania az egyik legnehezebb feladványt – derül ki a Live Science cikkéből. A gép először átnézte a kérdéshez kapcsolódó irodalmat, majd próbamegoldást készített, és a megoldásba is belevágott – végül tökéletes, gondolatmenettel alátámasztott választ adott. Az o4‑mini ráadásul hihetetlenül gyors volt – percek alatt oldotta meg azt, ami egy matematikusnak hetekig vagy hónapokig tartana. Az egyik matematikus így fogalmazott a gép teljesítményéről:

Nem számítottam ilyen eredményekre – ezt a fajta érvelést még soha nem láttam egyetlen modelltől sem. Szinte ijesztő.

Ez is érdekelhet!
Tesztelték: akár egy űrhajót is képes lenne vezetni a ChatGPT

A résztvevőknek végül aztán sikerült 10 olyan feladványt találniuk, amelyek kifogtak az o4‑minin, de a teljesítmény így is elképesztő volt – olyannyira, hogy a matematikusok aggodalmukat fejezték ki. Az egyik résztvevő szerint a gép ugyanis már nem csak a logika erejével, de a megfélemlítés eszközével is dolgozik – a rendszer ugyanis túl magabiztosan prezentálta a válaszait.

Figyelmedbe ajánljuk!
Egyre többen kérnek párkapcsolati tanácsot a ChatGPT-től

Mi lesz a jövőben?

A találkozó végén a résztvevők csoportja a matematikusok jövőjéről kezdett el gondolkodni, ugyanis mindannyiukat foglalkoztatta az a kérdés, hogy mi lesz, ha a gépek elérik az úgynevezett ötödik szintet – ahol már az emberi matematikusok is „megállnak”. Ha az AI eljut ide, a matematikusok szerepe radikálisan megváltozhat. Az egyik tudós így fogalmazott:

Nem akarok pánikot kelteni, de bizonyos szempontból ezek a nagy nyelvi modellek már most is felülmúlják a világ legjobb tehetségeinek többségét.

Olvasd el ezt is!

Egy új mesterséges intelligencia pár csepp vérből képes rákdiagnózist adni

Génmódosított, mesterséges intelligenciával rendelkező szuperkatonákat állíthat elő Kína

5 dolog, amire a mesterséges intelligencia sosem lesz képes

Nyitókép: AI és a matematika / Summit Art Creations/Shutterstock

matematika

mesterséges intelligencia

meglepő

eredmény