Gemini Deep Think pecahkan problem matematika terbuka dan tembus ICLR

AI · 11 Februari 2026 · 5 bulan lalu · sumber (deepmind.google)

Posting DeepMind ini luar biasa spesifik soal apa yang sebenarnya dikerjakan Gemini Deep Think. Di matematika, ia memecahkan sendiri empat problem terbuka dari database Erdős, menghasilkan paper ber-peer-review soal eigenweight di arithmetic geometry tanpa campur tangan manusia, dan mencapai sekitar 90 persen pada tes IMO-ProofBench Advanced seiring inference compute ditambah. Di fisika dan computer science, ia menyumbang pada 18 problem kolaboratif, menuntaskan konjektur berumur satu dekade di online submodular optimization lewat counterexample spesifik, dan satu papernya diterima ke ICLR 2026.

Metodenya sama pentingnya dengan hasil. Semua berjalan lewat agent riset matematika bernama Aletheia yang berputar antara generation, verification, dan revision sambil memakai web search untuk menangkap halusinasi. Kolaborasi dengan manusia ditata sebagai hubungan advisor, dengan langkah-langkah sengaja untuk menekan confirmation bias. Posting ini juga melacak kemajuan dari waktu ke waktu, dari versi peraih emas IMO Juli 2025 sampai versi Januari 2026. Catatan lengkapnya di blog DeepMind.

Kenapa ini penting

Kalau kamu peneliti, intinya bukan jumlah problem yang dipecahkan, tapi verification loop-nya. Hasil yang bertahan datang dengan struktur generate, verify, revise plus advisor manusia yang mengecek bias, dan justru bagian itu yang harus kamu tiru sebelum berani mempercayai output seperti ini di bidangmu.

Google DeepMind Mathematics