← semua berita

Claude Opus 4.7: input vision lebih besar, coding panjang lebih stabil

AI · · 1 bulan lalu · sumber (anthropic.com)

Anthropic merilis Claude Opus 4.7. Inti beritanya bukan satu kemenangan benchmark, tapi kerja panjang yang lebih stabil. Menurut Anthropic, model ini menangani coding multi-langkah dengan lebih konsisten, dan penguji berani menyerahkan pekerjaan tersulit mereka dengan pengawasan lebih longgar. Angkanya: naik 13 persen pada benchmark coding 93 task, dan sekitar tiga kali lebih banyak production task yang tuntas dibanding 4.6.

Vision juga membaik. Opus 4.7 menerima gambar sampai 2.576 piksel di sisi terpanjang, sekitar 3,75 megapiksel, lebih dari tiga kali batas lama. Pada satu benchmark visual-acuity Anthropic mencatat lonjakan besar, 98,5 persen lawan 54,5 persen untuk 4.6. Ia juga lebih tahan di agentic loop multi-langkah, lebih baik memulihkan diri dari error, dan lebih kuat menjaga long-context memory antar sesi. Harga tetap, 5 dolar per juta token input dan 25 dolar per juta output. Ada level effort baru, xhigh, yang menyelip di antara high dan max.

Satu trade-off dinyatakan terang-terangan: tokenizer baru memakai 1,0 sampai 1,35 kali lebih banyak token per input, walau efisiensi bersih membaik pada task coding yang mereka uji. Detailnya di situs Anthropic.

Kenapa ini penting

Kalau kamu menjalankan Claude di produksi, perubahan tokenizer ini yang pertama harus kamu hitung. Token per input yang naik bisa diam-diam memakan harga per-token yang sudah kamu anggarkan, jadi klaim "tiga kali production task" sebaiknya diuji dulu di workload sendiri sebelum dianggap untung bersih.

AnthropicClaudeModels