Yang membuat coding agent benar-benar jalan: enam bagian harness-nya
Sebastian Raschka membongkar apa yang sebenarnya berada di antara model dan coding agent yang berfungsi. Harness membungkus model dalam loop observation, inspection, choice, action, lalu mengelola enam hal. Pertama, live repo context: status Git, branch, dan layout ditarik di awal supaya perintah seperti "fix the tests" punya makna. Kedua, prompt shape: prefix yang stabil dijaga tetap ter-cache dan hanya history terbaru yang diperbarui, dan justru ini yang membuat sesi panjang terjangkau. Ketiga, tool access: saran berbentuk prosa diganti tool terdefinisi yang divalidasi harness, dicek izinnya, dijalankan, lalu hasilnya diumpankan balik.
Tiga sisanya mengurus ekor panjang. Context reduction memotong output panjang, membuang pembacaan file yang berulang, dan mengompres transkrip lama lebih agresif daripada peristiwa terbaru. Structured session memory menyimpan dua lapis, transkrip penuh yang tahan lama dan working memory yang sudah diringkas, sehingga task bisa dilanjutkan. Bounded subagents mewarisi konteks secukupnya tapi dibatasi, read-only atau berbatas rekursi, supaya tidak beranak tak terkendali. Benang merahnya jelas: harness, bukan chat polos, yang membuat model yang sama jadi kompeten. Tulisan lengkapnya di Ahead of AI.
Kenapa ini penting
Kalau kamu membangun atau menilai agent, ini checklist-nya. Saat agent gagal, biasanya yang bermasalah salah satu dari enam ini, bukan modelnya, jadi menamainya menunjukkan ke mana harus melihat sebelum buru-buru ganti model yang lebih besar.