Claude Tulis 80% Kode Anthropic, Perusahaan Ini Justru Minta Dunia Jeda dari AI
Claude Tulis 80% Kode Anthropic, Perusahaan Ini Justru Minta Dunia Jeda dari AI
CLB.my.id - Anthropic baru saja merilis data yang membuat dunia teknologi terdiam. Claude, model AI buatan mereka, kini menulis lebih dari 80% seluruh kode yang masuk ke produksi Anthropic. Angka itu naik drastis dari hanya satu digit persentase saat Claude Code pertama kali diluncurkan pada Februari 2025.
Yang lebih mengejutkan, satu insinyur Anthropic dilaporkan tidak menulis satu baris kode pun selama lima bulan terakhir. Bukan karena pekerjaannya selesai, melainkan karena Claude sudah mengambil alih seluruh proses implementasi.
Data ini diungkap dalam makalah terbaru Anthropic Institute berjudul “When AI Builds Itself” yang dipublikasikan pekan ini. Makalah tersebut bukan sekadar laporan produktivitas internal, melainkan peringatan keras tentang potensi rekursif self-improvement pada sistem AI.
Produktivitas Meledak, Manusia 8 Kali Lebih Produktif
Angka produktivitas yang dirilis Anthropic tergolong luar biasa. Pada kuartal kedua 2026, rata-rata insinyur Anthropic menggabungkan delapan kali lebih banyak kode per hari dibandingkan 2024. Survei internal terhadap 130 staf penelitian menunjukkan bahwa median responden memperkirakan mereka menghasilkan empat kali lebih banyak output dengan model terbaru Anthropic, Mythos Preview, dibandingkan bekerja tanpa AI.
Untuk masalah teknik yang paling kompleks dan terbuka, tingkat keberhasilan Claude naik menjadi 76% pada Mei 2026. Itu berarti kenaikan 50 poin persentase hanya dalam enam bulan.
Anthropic memberikan contoh konkret. Ketika sebuah pembaruan rutin menyebabkan puluhan ribu job training crash, seorang insinyur hanya memberikan Claude akses ke klaster komputasi dan konteks singkat dari insiden tersebut. Claude berhasil mengisolasi flag debugging yang tersembunyi, mereproduksi crash, dan mengonfirmasi perbaikan dalam waktu sekitar dua jam. Jika dikerjakan manusia, estimasi normalnya dua hingga tiga hari.
Kualitas Kode yang Makin Tak Terbedakan
Perbedaan kualitas antara kode yang ditulis manusia dan Claude juga menyusut cepat. Pada akhir 2025, staf Anthropic menilai kode buatan Claude “sedikit lebih buruk” dari tulisan manusia. Saat ini, keduanya berada di level yang setara. Dan staf Anthropic memperkirakan kode Claude akan menjadi “secara konsisten lebih baik” dalam tahun ini.
Sistem reviewer otomatis berbasis Claude kini memeriksa setiap perubahan kode sebelum digabungkan ke basis kode Anthropic. Analisis retrospektif menunjukkan reviewer ini akan menangkap sekitar sepertiga bug yang sebelumnya menyebabkan insiden produksi di claude.ai.
Dari Menulis Kode ke Melakukan Riset AI
Anthropic mengakui bahwa menulis kode lebih mudah daripada melakukan riset terbuka, tetapi eksperimen internal mereka menunjukkan kemampuan riset AI juga berkembang pesat.
Pada April 2026, Anthropic mempublikasikan demonstrasi di mana sembilan agen Claude paralel menjalankan proyek riset keamanan AI secara end to end. Agen-agen tersebut mengajukan hipotesis, menjalankan eksperimen, berbagi temuan melalui forum bersama, dan beriterasi.
Hasilnya mencengangkan. Dari 800 jam kerja kumulatif dengan biaya komputasi sekitar 18.000 dolar AS, agen-agen tersebut memulihkan 97% celah performa pada tugas yang diberikan. Dua peneliti manusia yang bekerja selama seminggu hanya mampu memulihkan 23%.
Dalam pengujian kemampuan memilih langkah selanjutnya selama sesi riset, Claude mencocokkan penilaian manusia 51% waktu pada November 2025. Pada April 2026, angka itu naik menjadi 64%.
Tren dari METR: Tugas Berdurasi Makin Panjang
Temuan internal Anthropic sejalan dengan benchmark dari METR, organisasi nirlaba yang mengukur kemampuan AI. Durasi tugas yang bisa diselesaikan AI secara mandiri telah berlipat ganda setiap empat bulan, lebih cepat dari tujuh bulan sebelumnya.
Pada Maret 2024, Claude Opus 3 bisa menangani tugas yang membutuhkan waktu empat menit bagi manusia. Pada awal 2025, Claude Sonnet 3.7 menangani tugas berdurasi satu setengah jam. Saat ini, Claude Opus 4.6 menangani tugas 12 jam, dan Mythos Preview bisa bekerja setidaknya 16 jam terus menerus.
Dampaknya sudah terlihat di GitHub. Dari sekitar satu miliar commit kode di seluruh 2025, GitHub kini memproses 275 juta commit per minggu, menuju 14 miliar selama tahun ini. Claude Code sendiri menyumbang 4,5% dari seluruh commit publik di GitHub, menghasilkan 2,6 juta commit per minggu.
Paradox Anthropic: Jual Revolusi, Peringatkan Bahaya
Bagian paling signifikan dari makalah ini bukan soal produktivitas, melainkan seruan untuk mekanisme global yang bisa memverifikasi perlambatan atau penghentian sementara pengembangan AI frontier.
Anthropic mengakui bahwa penghentian sepihak oleh satu laboratorium hanya akan mengubah siapa yang memimpin, bukan menciptakan proses deliberatif yang dibutuhkan. Yang diusulkan adalah sistem di mana beberapa laboratorium frontier di berbagai negara bisa sepakat berhenti dalam kondisi yang sama dan memverifikasi bahwa pihak lain benar-benar melakukannya.
Namun Anthropic juga menjual Claude sebagai revolusi produktivitas. Tensi antara keduanya menjadi pertanyaan besar: apakah ini transparansi yang berprinsip atau posisi strategis?
Makalah tersebut menggambarkan tiga skenario masa depan. Pertama, tren saat ini berhenti tetapi kemampuan yang sudah ada tetap mengubah ekonomi. Kedua, pengembangan AI menjadi sepenuhnya otomatis sementara manusia masih menentukan arah riset. Ketiga, sistem AI mencapai rekursif self-improvement penuh dan mulai merancang penerusnya sendiri.
Anthropic mengaku tidak punya “intuisi yang baik” untuk skenario ketiga. Tetapi mereka memberikan satu observasi: bahkan kecerdasan rekursif tidak bisa mempercepat semua hal. Ia tidak bisa mempelajari efek obat dalam puluhan tahun, mempercepat pemilihan umum, atau menjadikan orang asing teman lama dalam seminggu.
Di tengah semua itu, Anthropic sedang mempersiapkan penawaran umum perdana setelah penggalangan dana Seri H senilai 65 miliar dolar AS yang menempatkan valuasinya di 965 miliar dolar AS. Perusahaan yang memperingatkan dunia tentang bahaya AI ini, secara bersamaan, adalah salah satu yang paling diuntungkan dari ledakan AI.
Sumber: The Next Web, Anthropic Institute Paper “When AI Builds Itself”