Gemma 4: open model kecil yang jauh melampaui jumlah parameternya
Gemma 4 dari Google hadir dalam empat ukuran: effective 2B untuk edge, effective 4B untuk mobile, 26B mixture-of-experts, dan 31B dense untuk kualitas tertinggi. Klaim yang layak diuji adalah soal intelligence per parameter. Google menyebut model 31B dense menempati peringkat 3 di antara open model pada leaderboard teks Arena dan yang 26B di peringkat 6, keduanya mengalahkan model yang jauh lebih besar.
Daftar fiturnya membidik pembangun agent, bukan sekadar chat: native function calling dan output JSON terstruktur, reasoning multi-langkah, code generation, context window 128K sampai 256K, input multimodal termasuk video dan audio di model yang lebih kecil, serta training lintas lebih dari 140 bahasa. Lisensinya Apache 2.0 yang permisif untuk komersial, dan justru bagian itu yang menentukan tim bisa men-deploy-nya tanpa tinjauan hukum atau tidak. Pengumumannya di blog Google.
Kenapa ini penting
Kalau kamu menjalankan model di hardware sendiri, yang perlu kamu verifikasi adalah perpaduan ukuran kecil, peringkat Arena tinggi, dan lisensi Apache 2.0. Kalau peringkat itu bertahan pada task-mu, open model 26B atau 31B mengubah apa yang bisa kamu self-host alih-alih menyewa lewat API.