Claude Opus 4.8: Peningkatan Jujur Anthropic yang Klaim Hanya Perbaikan Kecil

CLB.my.id - Anthropic merilis Claude Opus 4.8, pembaruan terbaru untuk lini model bahasa andalannya. Alih-alih mengklaim lompatan besar, perusahaan di balik chatbot Claude itu justru menyebut pembaruan ini sebagai “perbaikan sederhana namun nyata.” Kalimat jujur itu menjadi sorotan tersendiri di tengah persaingan model AI yang kerap menggembar-gemborkan kemampuan revolusioner.

Simon Willison, pengembang sekaligus pengamat AI yang dikenal luas di komunitas teknologi, menggarisbawahi kejujuran tersebut dalam catatannya. Menurut dia, sangat menyegarkan melihat laboratorium AI mengakui secara terbuka bahwa rilis terbaru mereka hanyalah peningkatan bertahap, bukan revolusi.

Kejujuran sebagai Fitur Utama

Yang menarik, kejujuran bukan sekadar gaya pemasaran. Anthropic menyatakan bahwa Claude Opus 4.8 secara khusus dilatih untuk lebih waspada terhadap ketidakpastian. Model ini dilaporkan empat kali lebih kecil kemungkinannya dibanding pendahulunya untuk membiarkan kesalahan dalam kode yang ditulisnya sendiri lolos tanpa dicatat.

Dalam dokumen sistem yang dirilis bersamaan, Anthropic menuliskan bahwa Claude Opus 4.8 mencatat tingkat kesalahan terendah di antara enam model yang diuji pada setiap benchmark. Capaian itu diperoleh terutama karena model ini memilih untuk tidak menjawab ketika ragu, alih-alih memaksakan jawaban yang tidak akurat.

Kemampuan Agen dan Kode yang Lebih Tangguh

Dari sisi teknis, Opus 4.8 menunjukkan peningkatan signifikan dalam kemampuan agen. Dalam benchmark Super-Agent, model ini menjadi satu-satunya yang menyelesaikan setiap kasus secara end to end, mengalahkan model Opus sebelumnya dan bahkan GPT-5.5.

Untuk pengembang yang bekerja dengan Claude Code, peningkatan terasa pada kemampuan penilaian. Model ini dilaporkan lebih sering mengajukan pertanyaan yang tepat, menangkap kesalahan sendiri, dan bahkan menolak rencana yang dianggap tidak solid. Di CursorBench, Opus 4.8 melampaui model Opus sebelumnya di setiap level usaha, dengan pemanggilan alat yang lebih efisien.

Fitur baru yang menyertai rilis ini adalah Dynamic Workflows dalam Claude Code. Fitur ini memungkinkan Claude menangani tugas besar dengan merencanakan pekerjaan dan menjalankan ratusan sub-agen secara paralel. Anthropic mengklaim Claude Code dengan Opus 4.8 kini mampu melakukan migrasi skala basis kode yang mencakup ratusan ribu baris kode, dari perencanaan hingga penggabungan.

Harga Tetap, Fitur Baru

Dari sisi harga, tidak ada perubahan. Claude Opus 4.8 dibanderol lima dolar AS per juta token masukan dan 25 dolar AS per juta token keluaran, sama persis dengan Opus 4.7.

Yang baru adalah fast mode, yakni mode cepat yang menawarkan kecepatan 2,5 kali lipat dengan sepertiga biaya dari model sebelumnya. Fast mode dibanderol 10 dolar AS per juta token masukan dan 50 dolar AS per juta token keluaran. Fitur ini saat ini tersedia dalam pratinjau riset untuk organisasi tertentu.

Selain itu, ada perubahan teknis yang cukup signifikan bagi pengembang. Claude Opus 4.8 kini menerima pesan sistem (system messages) di tengah percakapan. Ini artinya pengembang bisa memperbarui instruksi model di tengah tugas tanpa mengulang seluruh prompt sistem, yang menghemat biaya dan menjaga efisiensi cache.

Batas minimum untuk cache prompt juga diturunkan menjadi 1.024 token, lebih kecil dari sebelumnya yang mencapai 4.096 token.

Ke Depan: Model Lebih Cerdas dan Lebih Murah

Anthropic mengisyaratkan dua arah pengembangan ke depan. Pertama, mereka sedang bekerja untuk menghadirkan kemampuan setara Opus dengan harga lebih terjangkau. Kedua, ada proyek bernama Glasswing yang bertujuan membawa model kelas Claude Mythos Preview, yang diklaim lebih cerdas dari Opus, ke semua pelanggan dalam beberapa minggu ke depan.

Namun Anthropic juga mengingatkan bahwa model dengan kemampuan setinggi itu memerlukan perlindungan siber yang lebih kuat sebelum bisa dirilis secara umum.

Claude Opus 4.8 sudah tersedia mulai hari ini melalui Claude API dengan pengenal model claude-opus-4-8. Konteks window tetap satu juta token dengan keluaran maksimal 128.000 token. Titik pengetahuan yang andal dan data pelatihan sama dengan Opus 4.7, yakni Januari 2026.

Claude Opus 4.8: Peningkatan Jujur Anthropic yang Klaim Hanya Perbaikan Kecil

Kejujuran sebagai Fitur Utama

Kemampuan Agen dan Kode yang Lebih Tangguh

Harga Tetap, Fitur Baru

Ke Depan: Model Lebih Cerdas dan Lebih Murah

Read more

15 Plugin JetBrains Marketplace Ketahuan Curi API Key AI, Total 70 Ribu Pengguna Terdampak

Satu Klik di Microsoft 365 Copilot Bisa Bocorkan Email, File Rahasia, dan Kode MFA Perusahaan

Serangan Agentjacking Bikin Agen AI Coding Jalankan Kode Jahat Tanpa Disadari Pengembang

GitHub Copilot Kini Punya Agent Finder, Agen AI Bisa Cari Tools yang Dibutuhkan Sendiri