Xiaomi Rilis Agen Coding yang Bisa 'Bermimpi' Setiap 7 Hari, Kalahkan Claude Code di Tugas Panjang
Xiaomi Rilis Agen Coding yang Bisa ‘Bermimpi’ Setiap 7 Hari, Kalahkan Claude Code di Tugas Panjang
CLB.my.id - Xiaomi merilis MiMo Code, agen coding terminal berbasis open-source dengan lisensi MIT yang punya fitur unik: setiap 7 hari, agen ini “tidur” dan menjalankan proses maintenance memori secara otonom. Fitur yang disebut “Dream” ini menjadi salah satu alasan mengapa MiMo Code berhasil mengalahkan Claude Code dalam lebih dari 65 persen tugas yang membutuhkan lebih dari 200 langkah eksekusi.
MiMo Code diluncurkan pada 10 Juni 2026 sebagai fork dari OpenCode, proyek open-source yang sudah mengumpulkan sekitar 170.000 bintang di GitHub. Agen ini tersedia secara gratis untuk sementara waktu dengan model default MiMo-V2.5 yang memiliki konteks 1 juta token.
Masalah yang Dipecahkan
Setiap agen coding yang bekerja pada tugas panjang menghadapi masalah yang sama: memori membusuk. Seiring bertambahnya percakapan dan langkah eksekusi, agen kehilangan konteks tentang apa yang sudah dikerjakan, file mana yang sudah diubah, dan keputusan desain apa yang sudah diambil. Akibatnya, agen sering mengulang pekerjaan yang sama atau membuat keputusan yang bertentangan dengan pilihan sebelumnya.
MiMo Code memecahkan masalah ini dengan pendekatan arsitektur yang berbeda dari kebanyakan agen coding lainnya. Kuncinya adalah pemisahan total antara agen utama yang mengerjakan tugas dan sub-agen yang mengelola memori.
Tiga Lapisan Inovasi
Pertama, ada “Max Mode” yang berfungsi sebagai hakim multi-otak. Di setiap giliran, lima respons kandidat dihasilkan secara paralel, lalu sebuah model “hakim” dengan suhu rendah membandingkan kelima rencana dan memilih yang paling kokoh untuk dieksekusi. Pendekatan ini meningkatkan skor SWE-Bench Pro sebesar 10 hingga 20 persen, meskipun dengan biaya token empat hingga lima kali lipat.
Kedua, ada “Goal” yang berfungsi sebagai verifikasi yang tidak mudah menyerah. Fitur ini mencegah agen mendeklarasikan kemenangan terlalu dini pada tugas berjangka panjang. Pengguna mendefinisikan kondisi berhenti dalam bahasa natural, misalnya “semua tes lulus dan kode sudah di-commit.” Setiap kali agen mencoba mengakhiri tugas, model independen akan memeriksa apakah kondisi tersebut benar-benar terpenuhi.
Ketiga dan yang paling inovatif adalah “Checkpoint Writer,” sub-agen terpisah yang bertugas menjaga memori agen utama. Agen utama sama sekali tidak diizinkan mengelola memorinya sendiri. Sub-agen ini mengekstrak keadaan terstruktur pada titik 20, 45, dan 70 persen utilisasi jendela konteks, lalu menulis file keadaan dengan 11 field yang mencakup niat, tindakan berikutnya, batasan, pohon tugas, file yang terlibat, error, dan keputusan desain.
Dream dan Distill: Pemeliharaan Terjadwal
Fitur Dream berjalan setiap 7 hari. Sebuah agen independen membaca sesi historis, menggabungkan memori yang duplikat, menghapus referensi ke file yang sudah tidak ada, dan mengompresi semua pengetahuan tentang proyek menjadi representasi yang lebih ringkas. Xiaomi menyebutnya “pemeliharaan memori mesin” yang terinspirasi dari cara biologi memproses informasi saat tidur.
Selain Dream, ada juga Distill yang berjalan setiap 30 hari. Proses ini memiliki mandat berbeda: mengabaikan pengetahuan dan mencari pola kerja berulang yang bisa dikristalisasi menjadi keterampilan yang bisa digunakan kembali, perintah CLI, agen kustom, dan dokumen SOP. Pendekatan ini mendekati konsep “self-improvement” yang sesungguhnya dalam agen mainstream.
Empat Lapisan Memori
Persistensi memori diatur dalam empat lapisan dengan siklus hidup berbeda. Lapisan Session menyimpan keadaan kerja saat ini dalam file checkpoint.md. Lapisan Project menyimpan keputusan arsitektur, aturan pengguna, dan fakta yang sudah diverifikasi dalam MEMORY.md secara persisten. Lapisan Global menyimpan preferensi lintas proyek. Lapisan History menyimpan teks mentah setiap pesan dan panggilan tool dalam SQLite secara permanen.
Agen utama hanya memiliki akses baca-saja ke semua file terstruktur kecuali notes.md, sebuah scratchpad yang bisa ia tambahkan catatan. Satu penulis per file diterapkan untuk menjaga pemisahan data yang bersih.
Klaim Performa dan Konteks Penting
Dalam 1.213 tes A/B buta ganda yang melibatkan 576 pengembang di 474 repositori pribadi, MiMo Code memenangkan lebih dari 65 persen tugas setelah eksekusi melewati 200 langkah. Di bawah 200 langkah, rasio kemenangan sekitar 50 persen, menunjukkan bahwa keunggulan MiMo Code baru terlihat pada tugas-tugas kompleks jangka panjang.
Perlu dicatat bahwa semua angka ini dilaporkan oleh Xiaomi sendiri dan belum ada replikasi independen. Benchmark offline mengukur pemecahan one-shot di mana mesin memori MiMo tidak memberikan keuntungan. Angka 65 persen berasal dari studi A/B buta ganda yang dibangun Xiaomi sendiri.
MiMo Code tersedia dengan instalasi satu baris melalui npm atau curl. Satu catatan penting: telemetry diaktifkan secara default dan mengirim data ke tracking.miui.com. Pengguna yang peduli privasi disarankan untuk menonaktifkan analytics segera setelah instalasi dengan menambahkan variabel lingkungan MIMOCODE_ENABLE_ANALYSIS=false.