← semua berita

Model robotika terbuka Ai2 ungguli model proprietary

AI · · 13 jam lalu · sumber (allenai.org)

Allen Institute for AI merilis MolmoAct 2, sebuah foundation model robotika, lengkap dengan bobot model, data training, dan kode yang semuanya terbuka. Klaimnya: model ini menalar adegan dalam 3D sebelum bertindak, dan menangani manipulasi satu lengan maupun dua lengan tanpa fine-tuning per tugas. Inti vision-language-nya, Molmo 2-ER, dilatih dengan sekitar 3 juta contoh penalaran embodied tambahan dan meraih rata-rata 63,8 dari 100 di 13 benchmark penalaran spasial, di atas GPT-5, Gemini 2.5 Pro, dan Qwen3-VL-8B pada rangkaian itu.

Angka yang dilaporkan Ai2 cukup spesifik. Pada uji zero-shot dunia nyata memakai lengan Franka, MolmoAct 2 mencapai tingkat keberhasilan 87,1 persen, sementara π0.5 milik Physical Intelligence yang proprietary hanya 45,2 persen. Di simulasi pada benchmark rumah tangga MolmoBot, angkanya nyaris dua kali lipat π0.5, yakni 20,6 persen berbanding 10,3 persen. Kecepatannya juga melonjak: sekitar 180 milidetik per aksi dibanding 6.700 milidetik pada MolmoAct orisinal, yang oleh Ai2 disebut hingga 37 kali lebih cepat. Mekanisme depth-token hanya menjalankan penalaran 3D yang berat saat diperkirakan berguna, sehingga menghemat 17 persen dibanding selalu memprediksi depth.

Ai2 juga merilis dataset MolmoAct 2-Bimanual YAM, yang disebutnya set manipulasi meja dua lengan terbuka terbesar sejauh ini, dengan lebih dari 720 jam demonstrasi. Kombinasi bobot terbuka dan resep training itu berguna khususnya bagi siapa pun yang tak bisa melatih kebijakan robot dari nol.

Kenapa ini penting

Kalau kamu menggarap manipulasi robot, model terbuka yang mengungguli baseline proprietary kuat dengan selisih lebar dan ikut merilis data serta resepnya berarti kamu bisa membangun langsung di atasnya, alih-alih mengumpulkan ratusan jam demonstrasi sendiri.

Open ModelsAllen InstituteRobotics