ChatGPT löser öppet matematikproblem med artificiell intelligens

Artificiell intelligens har tagit ett steg som för inte länge sedan verkade som ren science fiction: den senaste versionen av ChatGPT löste självständigt ett av de komplexa matematiska problem som klassificeras som "öppna". Detta framhölls av forskaren och utvecklaren Neil Somani, som presenterade modellen med ett icke-trivialt problem och lät den arbeta utan mänsklig inblandning. Efter ungefär 15 minuter producerade systemet en detaljerad lösning, som Somani sedan verifierade och formaliserade med det matematiska verktyget Harmonic – vilket bekräftade att beviset var korrekt.

Somanis mål var att förstå var gränsen går för moderna stora språkmodellers förmågor inom matematik. Experimentresultaten visade sig vara överraskande starka: den senaste ChatGPT-versionen hanterade komplexa koncept med självförtroende och demonstrerade en resonemangsnivå som tidigare ansågs otillgänglig för AI. Enligt forskaren förändrar detta vår förståelse av vilka uppgifter maskiner kan lösa på egen hand.

I sin resonemangsprocess hittade modellen inte bara ett svar utan tillämpade sekventiellt grundläggande matematiska idéer och formler, med utgångspunkt i verk som diskuterats i det professionella samfundet för över ett decennium sedan. Den slutgiltiga lösningen var inte en kopia av kända tillvägagångssätt utan en självständig och mer komplett härledning för en problemvariant som ursprungligen formulerades av Paul Erdős. Denna nivå av generalisering och anpassning var en gång uteslutande karakteristisk för människor.

Somani noterar att ett märkbart språng inträffade efter lanseringen av version GPT 5.2: antalet problem som AI hanterar utan direkt assistans har ökat kraftigt. Även om tidiga autonoma framgångar inom detta område dokumenterades tidigare har framstegen nu blivit svåra att ignorera. Experter betonar att AI inte ersätter matematiker utan i allt högre grad blir ett kraftfullt verktyg som kan påskynda lösningsupptäckter och utvidga gränserna för mänsklig kunskap.