AlphaEvolve naik kelas dari demo riset jadi tool produksi, dengan angka nyata
Google DeepMind merilis kabar terbaru AlphaEvolve, coding agent bertenaga Gemini. Beritanya lebih soal di mana ia mendarat ketimbang seberapa pintar modelnya: sistem nyata, dengan angka yang cukup spesifik untuk dicek. AlphaEvolve mencari dan mengoptimalkan algoritma, dan posting ini menukar demo dengan hasil yang sudah ter-deploy.
Beberapa menonjol. Di Google Spanner, write amplification turun 20 persen dan jejak storage 9 persen. AlphaEvolve menyumbang optimasi untuk silikon TPU generasi berikutnya. Di luar Google, Klarna menggandakan kecepatan training sebuah model transformer, FM Logistic mencatat efisiensi rute naik 10,4 persen atau setara 15.000 km hemat per tahun, dan Schrödinger melihat sekitar empat kali speedup pada kerja molecular force field. Untuk sains yang lebih berat, DeepMind menyebut solusi feasible AC Optimal Power Flow naik dari 14 ke 88 persen, dan sirkuit kuantum dengan error sekitar sepuluh kali lebih rendah di prosesor Willow.
Tim membingkainya sebagai perpindahan dari prototipe riset ke tool produksi di Google Cloud, lengkap dengan pelanggan bernama, bukan sekadar demo internal. Posting lengkapnya di blog DeepMind.
Kenapa ini penting
Kalau kamu kerja di infrastruktur atau sistem ML, pertanyaan yang berguna adalah mana dari kemenangan ini yang bisa diulang di luar Google. Angka Spanner dan pelanggannya cukup konkret untuk diuji pada workload-mu sendiri, dan begitulah cara menilai klaim seluas ini.