ChatGPT'nin son sürümü yapay zekâ ile matematiksel muhakeme

Yapay zekâ, yakın zamana kadar bilim kurgu gibi görünen bir adım attı: ChatGPT'nin en son sürümü, "açık" olarak sınıflandırılan karmaşık matematik problemlerinden birini bağımsız olarak çözdü. Bunu araştırmacı ve geliştirici Neil Somani vurguladı. Somani, modele önemsiz olmayan bir problem sundu ve insan müdahalesi olmadan çalışmasına izin verdi. Yaklaşık 15 dakika sonra sistem detaylı bir çözüm üretti. Somani daha sonra bu çözümü matematiksel araç Harmonic ile doğrulayıp resmileştirdi ve ispatın doğru olduğunu teyit etti.

Somani'nin amacı, modern büyük dil modellerinin matematikteki yetenek sınırının nerede olduğunu anlamaktı. Deneysel sonuçlar şaşırtıcı derecede güçlü çıktı: ChatGPT'nin en son sürümü karmaşık kavramları güvenle ele aldı ve daha önce yapay zekâ için erişilemez kabul edilen bir muhakeme düzeyi sergiledi. Araştırmacıya göre bu durum, makinelerin hangi görevleri kendi başlarına çözebileceğine dair anlayışımızı önemli ölçüde değiştiriyor.

Model, muhakeme sürecinde sadece bir cevap bulmakla kalmadı; aynı zamanda temel matematiksel fikirleri ve formülleri sırayla uygulayarak, on yıldan uzun süre önce profesyonel toplulukta tartışılan çalışmalardan yararlandı. Nihai çözüm, bilinen yaklaşımların bir kopyası değildi. Paul Erdős tarafından orijinal olarak formüle edilen bir problem varyantı için bağımsız ve daha eksiksiz bir türetmeydi. Bu genelleme ve uyarlama düzeyi bir zamanlar yalnızca insanlara özgüydü.

Somani, GPT 5.2 sürümünün piyasaya sürülmesinden sonra gözle görülür bir sıçrama yaşandığını belirtiyor: Yapay zekânın doğrudan yardım olmadan ele aldığı problem sayısı keskin bir şekilde arttı. Bu alandaki ilk otonom başarılar daha önce kaydedilmiş olsa da, ilerleme artık göz ardı edilemeyecek kadar belirgin hale geldi. Uzmanlar, yapay zekânın matematikçilerin yerini almadığını, ancak çözüm keşfini hızlandırabilen ve insan bilgisinin sınırlarını genişletebilen güçlü bir araç olarak giderek daha fazla öne çıktığını vurguluyor.