Gemini 3.5 Live Translate Terjemahkan 70+ Bahasa Secara Langsung, Suara Penutur Tetap Natural
Gemini 3.5 Live Translate Terjemahkan 70+ Bahasa Secara Langsung, Suara Penutur Tetap Natural
CLB.my.id - Google merilis Gemini 3.5 Live Translate, model audio terbaru yang mampu menerjemahkan ucapan secara langsung (near real-time) ke dalam lebih dari 70 bahasa. Tidak seperti sistem terjemahan bergilir yang menunggu lawan bicara selesai berbicara, model ini menghasilkan ucapan terjemahan secara kontinu dengan hanya tertinggal beberapa detik dari pembicara asli.
Yang membuat Gemini 3.5 Live Translate berbeda dari pendahulunya adalah kemampuannya mempertahankan intonasi, ritme, dan nada suara pembicara asli. Artinya, hasil terjemahan terdengar natural, bukan seperti robot yang membaca teks. Model ini juga tangguh di lingkungan bising dan bisa menangani input multibahasa secara otomatis tanpa perlu pengaturan manual dari pengguna.
Google juga menanamkan watermark SynthID pada setiap audio yang dihasilkan. Watermark ini tidak terdengar oleh telinga manusia, tetapi bisa dideteksi oleh sistem otomatis untuk memverifikasi keaslian konten audio. Langkah ini diambil untuk mencegah penyalahgunaan teknologi suara AI dalam penyebaran misinformasi atau deepfake audio.
Hadir di Tiga Platform Sekaligus
Google mendistribusikan model ini ke tiga lapisan pengguna sekaligus. Untuk pengembang, Gemini 3.5 Live Translate sudah tersedia dalam tahap public preview melalui Gemini Live API dan Google AI Studio. Pengembang bisa memanfaatkannya untuk membangun fitur interpretasi langsung pada rapat, kelas, siaran, dan panggilan multibahasa. Beberapa mitra seperti Agora, Fishjam, LiveKit, Pipecat, dan Vision Agents sudah mulai mengintegrasikan API ini ke platform mereka.
Untuk kalangan enterprise, model ini masuk tahap private preview di Google Meet bulan ini. Sebelumnya, Google Meet hanya mendukung lima bahasa dan menerjemahkan ke dan dari bahasa Inggris saja. Dengan Gemini 3.5 Live Translate, dukungan melonjak menjadi lebih dari 70 bahasa dengan kombinasi lebih dari 2.000 pasang bahasa dalam satu rapat. Perusahaan ride-hailing Grab bahkan sudah menguji model ini untuk komunikasi real-time antara pengemudi dan penumpang, menangani lebih dari 10 juta panggilan suara per bulan.
Tersedia Gratis di Google Translate
Untuk pengguna umum, Gemini 3.5 Live Translate mulai diluncurkan secara global di aplikasi Google Translate untuk Android dan iOS. Pengguna cukup mengaktifkan fitur Live Translate dan menghubungkan headphone untuk mendengarkan terjemahan langsung yang meniru nada suara pembicara asli.
Pengguna Android mendapat fitur tambahan berupa listening mode. Cukup dekatkan ponsel ke telinga seperti sedang menelepon, dan audio terjemahan akan mengalir langsung melalui earpiece ponsel. Fitur ini berguna ketika pengguna ingin mendengar terjemahan secara pribadi tanpa orang lain mendengarnya.
Respons Positif dari Mitra Awal
Beberapa perusahaan yang sudah mencoba memberikan respons positif. CJ ENM dan LiveKit memuji kualitas terjemahan, akurasi, dan latensi rendah yang dihasilkan model ini. Google menyebut Gemini 3.5 Live Translate sebagai langkah besar menuju penghapusan hambatan bahasa dalam komunikasi sehari-hari, baik untuk bisnis maupun penggunaan personal.
Bagi pengembang di Indonesia, model ini membuka peluang besar untuk membangun aplikasi penerjemahan real-time yang mendukung bahasa Indonesia dan ratusan bahasa daerah lainnya. Dengan latensi rendah dan kualitas suara natural, teknologi ini bisa diterapkan pada layanan customer service, tur wisata, hingga pendidikan jarak jauh.***