Robot Nvidia Belajar Sendiri Lewat Agen AI, Capai Akurasi 99 Persen Tanpa Campur Tangan Manusia

CLB.my.id - Nvidia bersama Carnegie Mellon University dan UC Berkeley memperkenalkan ENPIRE, sebuah sistem yang memungkinkan robot melatih keterampilan canggih secara otonom melalui agen coding AI. Dalam penelitian yang dipublikasikan pekan lalu, delapan robot yang dikoordinasikan oleh agen AI berhasil mencapai tingkat keberhasilan hingga 99 persen pada tugas manipulasi benda yang membutuhkan presisi tinggi.

Sistem ini menandai perubahan signifikan dalam cara robot mempelajari keterampilan baru. Selama ini, proses pelatihan robot memerlukan keterlibatan manusia di setiap tahap, mulai dari pengumpulan data, pengaturan ulang posisi objek setelah setiap percobaan, hingga penyesuaian algoritma. ENPIRE mengubah seluruh siklus riset dan pelatihan itu menjadi loop otonom yang dijalankan oleh agen coding AI.

Cara Kerja ENPIRE dalam Dua Fase

Sistem ini beroperasi dalam dua fase utama. Fase pertama adalah persiapan lingkungan, di mana agen AI menetapkan batas keamanan, membangun mekanisme reset otomatis, dan mengembangkan evaluasi keberhasilan secara mandiri. Yang menarik, agen tersebut mampu menulis fungsi reward-nya sendiri hanya dari beberapa menit video contoh, tanpa perlu manusia menilai setiap percobaan.

Sebagai contoh, untuk tugas memasukkan pin ke lubang, agen menciptakan pemeriksa keberhasilan yang menggabungkan keselarasan visual, ketinggian gripper, dan estimasi gaya. Untuk tugas memotong kabel tie, agen menggunakan dua sudut kamera untuk menghindari positif palsu dengan waktu respons di bawah 150 milidetik.

Fase kedua adalah riset otonom. Dalam fase ini, agen bekerja sepenuhnya mandiri: membaca makalah ilmiah, membentuk hipotesis, dan langsung mengedit kode pelatihan. Agen secara otonom memilih metode yang akan digunakan, apakah behavior cloning (meniru demonstrasi) atau reinforcement learning (coba dan error), berdasarkan sinyal keberhasilan dari dunia nyata.

Koordinasi Armada Melalui Git

Sistem ENPIRE dapat diskalakan hingga delapan stasiun robot YAM berlengan ganda, masing-masing dengan perangkat keras, komputer, dan agen coding sendiri. Koordinasi antar robot dilakukan secara eksklusif melalui Git, sistem kontrol versi yang biasa digunakan oleh pengembang perangkat lunak.

Para agen menguji hipotesis yang berbeda secara bersamaan dan berbagi hasil melalui repositori Git. Strategi yang berhasil secara otomatis diadopsi oleh seluruh armada, sementara yang gagal dibuang. Terobosan yang ditemukan di satu stasiun langsung menyebar ke semua robot lainnya.

Hasil yang Mencengangkan

Pada tugas Push-T, di mana robot harus menggeser blok berbentuk T ke posisi dan orientasi target, ENPIRE mencapai keberhasilan hingga 99 persen. Untuk tugas menyortir pin ke dalam kotak dan memotong kabel tie dengan pemotong, hasilnya sama mengesankan. Pada tugas memasukkan pin, strategi yang dikembangkan agen mencapai konvergensi 100 persen lebih cepat dibandingkan metode yang melibatkan manusia.

Skalabilitas memberikan keuntungan waktu yang signifikan. Pada tugas Push-T, meningkatkan dari satu ke delapan agen memotong waktu penyelesaian dari sekitar lima jam menjadi sekitar dua jam. Untuk memasukkan pin, waktu turun dari lebih dari 90 menit menjadi sekitar 40 menit.

Codex Unggul dalam Uji Banding

Peneliti menguji tiga agen coding yang berbeda: Codex dengan GPT-5.5, Claude Code dengan Opus 4.7, dan Kimi Code dengan Kimi K2.6. Hasilnya, Codex dari OpenAI menunjukkan performa terbaik di sebagian besar kasus. Menariknya, keterampilan yang dipelajari bersifat transferable. Pengalaman dari tugas memasukkan pin membantu agen belajar memasang kartu grafis ke slot motherboard.

Namun, dunia nyata tetap menjadi ujian terberat. Pada tugas Push-T, semua agen berhasil dalam simulasi, tetapi dua dari tiga gagal di lingkungan nyata. Faktor-faktor yang tidak dapat diprediksi seperti dinamika robot, gesekan, dan pergerakan objek menjadi penyebab utama kegagalan.

Batasan dan Efisiensi

Para peneliti mengakui adanya trade-off antara kecepatan dan efisiensi. Agen menghabiskan waktu signifikan untuk membaca log, menulis kode, dan menunggu. Semakin besar armada, utilisasi per robot justru menurun karena agen menghabiskan lebih banyak waktu untuk merangkum hasil rekan-rekannya. Biaya token juga tumbuh lebih cepat daripada peningkatan performa.

Meskipun demikian, Jim Fan, salah satu kepala laboratorium GEAR di Nvidia, memproyeksikan ENPIRE sebagai langkah pertama menuju “AutoResearch di dunia fisik.” Nvidia berencana merilis sistem ini sebagai open source, memungkinkan universitas, startup, dan komunitas pengembang membangun laboratorium robot yang mampu meningkatkan diri sendiri.***

Robot Nvidia Belajar Sendiri Lewat Agen AI, Capai Akurasi 99 Persen Tanpa Campur Tangan Manusia

Robot Nvidia Belajar Sendiri Lewat Agen AI, Capai Akurasi 99 Persen Tanpa Campur Tangan Manusia

Cara Kerja ENPIRE dalam Dua Fase

Koordinasi Armada Melalui Git

Hasil yang Mencengangkan

Codex Unggul dalam Uji Banding

Batasan dan Efisiensi

Read more

15 Plugin JetBrains Marketplace Ketahuan Curi API Key AI, Total 70 Ribu Pengguna Terdampak

Satu Klik di Microsoft 365 Copilot Bisa Bocorkan Email, File Rahasia, dan Kode MFA Perusahaan

Serangan Agentjacking Bikin Agen AI Coding Jalankan Kode Jahat Tanpa Disadari Pengembang

GitHub Copilot Kini Punya Agent Finder, Agen AI Bisa Cari Tools yang Dibutuhkan Sendiri