Kembali ke Blog

Memperkenalkan StreamFluent: Penerjemah Suara AI Real-Time Pertama di Dunia untuk Live Streamer Kini Hadir

S

StreamFluent

16 Februari 202614 menit membaca0 tampilan
Memperkenalkan StreamFluent: Penerjemah Suara AI Real-Time Pertama di Dunia untuk Live Streamer Kini Hadir

Saat ini, di suatu tempat di Twitch, seorang streamer di São Paulo sedang melakukan salah satu speedrun paling mengesankan yang pernah ada di internet. Komentarnya sangat menarik. Chat mereka meledak. Mereka memiliki 8.000 penonton bersamaan dan setiap orang dari mereka berbicara bahasa Portugis.

Di sisi lain planet ini, audiens berbahasa Inggris yang berjumlah jutaan tidak akan pernah tahu streamer ini ada. Bukan karena kontennya tidak cukup bagus. Bukan karena gameplay-nya tidak ada. Tetapi karena satu tembok tak terlihat yang telah menentukan batasan hiburan online sejak webcam pertama ditayangkan: bahasa.

Hari ini, kami meruntuhkan tembok itu.

StreamFluent adalah platform sulih suara dan teks AI real-time pertama di dunia yang dibuat khusus untuk live streamer. Anda melakukan streaming sekali, dalam bahasa asli Anda. StreamFluent mendengarkan, mentranskripsi, menerjemahkan, dan menyuarakan ulang streaming Anda — dalam hingga 15+ bahasa — masing-masing dikirimkan ke saluran sendiri di Twitch, YouTube, Kick, atau platform yang kompatibel dengan RTMP mana pun.

Ini bukan sulih suara pasca-produksi. Ini bukan subtitle yang Anda tambahkan setelah VOD diunggah. Ini terjadi secara langsung, dalam latensi sub-detik, saat Anda bermain game, bereaksi, atau mengobrol dengan audiens Anda.

Izinkan kami menjelaskan bagaimana kami sampai di sini, apa yang kami bangun, dan mengapa kami percaya ini mengubah segalanya bagi para kreator.


Masalahnya: Bahasa Adalah Penghalang Terakhir dalam Live Streaming

Industri streaming telah memecahkan hampir semua masalah distribusi lainnya. Anda dapat melakukan siaran langsung dari kamar tidur Anda dan menjangkau pemirsa di setiap benua. Platform memiliki CDN global yang mengirimkan video dalam milidetik. Algoritma penemuan menampilkan konten ke audiens baru sepanjang waktu. Sistem pembayaran memungkinkan penggemar di Tokyo memberi tip kepada kreator di Toronto.

Tetapi bahasa? Bahasa masih menjadi tembok yang sulit.

Pertimbangkan matematikanya. Ada sekitar 2,5 juta streamer aktif di Twitch saja. Sebagian besar dari mereka melakukan streaming dalam satu bahasa. Bahasa Inggris mendominasi platform Barat, tetapi komunitas streaming yang tumbuh paling cepat adalah di Spanyol, Portugis, Jepang, Korea, dan Hindi. Audiens ini sangat besar, terlibat, dan sebagian besar terisolasi satu sama lain.

Seorang streamer berbahasa Spanyol dengan gameplay luar biasa dan kepribadian yang menarik mencapai batas saat calon pemirsa mereka tidak berbicara bahasa Spanyol. Hal yang sama berlaku sebaliknya — seorang kreator berbahasa Inggris dengan komunitas setia sebanyak 50.000 pada dasarnya tidak memiliki jangkauan ke internet berbahasa Jepang yang kuat dengan 500 juta orang.

Ini bukan masalah kecil. Ini adalah tuas pertumbuhan terbesar yang belum dimanfaatkan di seluruh ekonomi kreator. Dan sampai sekarang, solusinya tidak ada atau sangat tidak praktis:

  • Terjemahan manual? Anda memerlukan penerjemah manusia melalui panggilan suara, langsung, untuk setiap streaming, dalam setiap bahasa. Biayanya saja sudah sangat mahal. Latensinya membuatnya tidak layak ditonton.
  • Subtitle pasca-streaming? Lebih baik daripada tidak sama sekali untuk VOD, tetapi mereka tidak melakukan apa pun untuk jumlah penonton langsung — di situlah uang, komunitas, dan momentum berada.
  • Overlay teks berbasis browser? Beberapa alat memang ada, tetapi mereka hanya menangani teks subtitle, memerlukan pengaturan plugin OBS yang kompleks, dan tidak menyelesaikan masalah mendasar: suara Anda masih dalam satu bahasa.

Dunia streaming membutuhkan sesuatu yang sama sekali baru. Sebuah sistem yang dapat memproses ucapan, menerjemahkannya, dan mensintesis suara baru — semuanya secara real time, semuanya tanpa streamer mengubah alur kerja mereka.

Itulah yang kami bangun.


Apa yang Kami Bangun: Sulih Suara AI Real-Time untuk Live Stream

StreamFluent adalah alur AI real-time yang berada di antara encoder streaming Anda (OBS Studio, Streamlabs, atau perangkat lunak yang kompatibel dengan RTMP apa pun) dan platform tujuan Anda. Inilah yang terjadi saat Anda melakukan siaran langsung:

  1. Anda melakukan streaming seperti biasa dalam bahasa asli Anda. Tidak ada yang berubah dari pengaturan Anda kecuali URL tujuan RTMP di OBS.
  2. StreamFluent memasukkan streaming Anda melalui server relay RTMP kami. Video Anda lewat tanpa disentuh — kami tidak pernah menyandikan ulang video Anda.
  3. Alur AI kami memproses audio Anda secara real time: pengenalan ucapan mentranskripsi apa yang Anda katakan, terjemahan mesin mengubahnya menjadi bahasa target Anda, dan teks-ke-ucapan saraf mensintesis trek suara baru untuk setiap bahasa.
  4. Setiap streaming yang diterjemahkan dikirimkan ke tujuannya sendiri — saluran Twitch terpisah, streaming YouTube, atau saluran Kick — lengkap dengan trek audio yang disulihsuarakan dan subtitle yang disematkan opsional.

Hasilnya: Anda melakukan streaming sekali. Audiens Anda menonton dalam lima belas bahasa. Setiap versi terdengar alami, tetap sinkron, dan tiba dengan latensi sub-detik.

Mari kita uraikan setiap bagian.

Pengenalan Ucapan (STT)

Tahap pertama dari alur adalah pengenalan ucapan otomatis. Mesin STT StreamFluent memproses audio Anda secara real time, mengubah ucapan menjadi teks dengan akurasi tinggi bahkan di lingkungan game yang bising. Kami telah mengoptimalkan secara khusus untuk kasus penggunaan streaming — komentar yang berbicara cepat, audio game latar belakang, suara yang tumpang tindih, dan kekacauan umum dari siaran langsung.

Terjemahan Mesin

Setelah kami memiliki transkrip Anda, lapisan terjemahan kami mengubahnya menjadi bahasa target yang Anda konfigurasi. Saat ini kami mendukung 15 bahasa: Spanyol, Jepang, Portugis, Prancis, Jerman, Korea, Mandarin, Italia, Rusia, Arab, Hindi, Turki, Belanda, Polandia, dan Thailand — dengan lebih banyak lagi yang akan datang.

Mesin terjemahan disetel untuk percakapan, ucapan informal — cara streamer benar-benar berbicara — bukan keluaran kaku dan formal yang akan Anda dapatkan dari penerjemah dokumen generik.

Teks-ke-Ucapan Saraf (TTS)

Di sinilah keajaiban terjadi. StreamFluent tidak hanya menampilkan teks terjemahan. Ia mengucapkannya. Mesin TTS kami menghasilkan suara yang terdengar alami dalam bahasa target, disintesis secara real time.

Pada paket Pro kami, Anda dapat membuat model suara khusus hanya dari sampel audio 30 detik. Sistem mempelajari karakteristik suara Anda — nada, irama, energi — dan menerapkannya pada keluaran terjemahan. Streaming Spanyol Anda terdengar seperti Anda berbicara bahasa Spanyol, bukan robot generik.

Pada paket Bisnis kami, kami meluncurkan replikasi suara penuh dengan pelestarian emosi — suara yang disulihsuarakan akan membawa kegembiraan, frustrasi, dan humor Anda lintas bahasa. (Fitur ini akan segera hadir, dan penguji awal menyebutnya "menakutkan".)

Video Passthrough

Keputusan desain yang penting: kami tidak pernah menyandikan ulang video Anda. Streaming 1080p60 atau 4K Anda melewati server relay kami bit demi bit. Kami hanya menyentuh trek audio (dan secara opsional menyematkan overlay subtitle). Ini berarti tidak ada kehilangan kualitas, latensi tambahan minimal, dan tidak ada biaya GPU tambahan di pihak Anda.


Cara Kerjanya: Pengaturan dalam Kurang dari 2 Menit

Kami terobsesi untuk membuat StreamFluent sangat mudah diatur. Tidak ada plugin untuk diinstal, tidak ada kabel audio virtual untuk dikonfigurasi, tidak ada sumber browser untuk digumuli. Inilah seluruh alurnya:

Langkah 1: Buat Akun Anda

Mendaftar di streamfluent.ai dengan email Anda atau terhubung langsung dengan akun Twitch, YouTube, atau Google Anda. Tingkat gratis tersedia segera — tidak diperlukan kartu kredit.

Langkah 2: Atur Suara Anda

Untuk pengguna Pro dan Bisnis, rekam sampel suara 30 detik langsung di dasbor. Sistem kami menggunakan ini untuk membangun profil suara khusus Anda. Anda dapat menyesuaikan kecepatan bicara (0,5x hingga 2,0x) dan nada (-12 hingga +12 semitone) untuk menyempurnakan suara yang disulihsuarakan.

Pengguna tingkat gratis mendapatkan akses ke suara TTS standar berkualitas tinggi kami — masih terdengar alami, hanya saja tidak dipersonalisasi untuk suara spesifik Anda.

Langkah 3: Tambahkan Tujuan Anda

Di sinilah Anda mengonfigurasi ke mana setiap bahasa pergi. Untuk setiap bahasa target, Anda menentukan:

  • Bahasa (misalnya, Spanyol, Jepang)
  • Platform (Twitch, YouTube, Kick, atau URL RTMP khusus apa pun)
  • Kunci streaming untuk saluran itu
  • Mode sulih suara: sulih suara AI penuh, subtitle saja, atau keduanya

Anda dapat menjalankan tujuan sebanyak yang diizinkan oleh paket Anda — satu di tingkat Gratis, hingga tiga di Pro, dan tidak terbatas di Bisnis.

Langkah 4: Hubungkan OBS dan Siaran Langsung

Inilah bagian yang mengejutkan semua orang: Anda hanya mengubah URL streaming Anda di OBS. Itu saja.

Buka OBS Studio → Pengaturan → Streaming → pilih "Kustom..." → tempel URL RTMP dan kunci streaming StreamFluent Anda. Ini dihasilkan secara otomatis di dasbor Anda.

Server: rtmp://ingest.streamfluent.ai/live
Kunci Streaming: (kunci unik Anda dari dasbor)

Tekan "Mulai Streaming" di OBS. StreamFluent mengambil alih dari sana. Streaming asli Anda masuk ke saluran utama Anda (jika Anda telah mengonfigurasi tujuan passthrough), dan setiap versi terjemahan masuk ke saluran platform masing-masing.

Tidak ada plugin. Tidak ada driver audio virtual. Tidak ada sumber browser. Jika encoder Anda dapat mengeluarkan RTMP — dan hampir semuanya dapat — itu berfungsi dengan StreamFluent.


Subtitle dan Sulih Suara: Kontrol Penuh, Per Tujuan

Salah satu fitur yang paling banyak diminta selama beta kami adalah kontrol granular atas subtitle dan sulih suara berdasarkan per tujuan. Audiens yang berbeda memiliki preferensi yang berbeda, dan kami ingin memberi streamer fleksibilitas penuh.

Inilah cara kerjanya:

Mode Sulih Suara

Setiap tujuan dapat diatur ke salah satu dari tiga mode:

  • Sulih Suara Otomatis: Jika bahasa tujuan berbeda dari bahasa sumber Anda, sulih suara AI penuh diterapkan. Ini adalah default dan pengaturan yang paling umum.
  • Subtitle Saja: Suara asli Anda dipertahankan, tetapi subtitle terjemahan disematkan ke dalam video. Cocok untuk audiens yang lebih suka mendengar suara asli tetapi membutuhkan bantuan terjemahan.
  • Asli Saja: Streaming melewati tanpa sulih suara dan tanpa subtitle. Berguna untuk tujuan bahasa "rumah" Anda.

Subtitle yang Disematkan

Sistem subtitle StreamFluent merender teks terjemahan langsung ke dalam umpan video — tidak diperlukan ekstensi atau pengaturan sisi pemirsa. Semua orang yang menonton melihat subtitle, terlepas dari perangkat atau platform mereka.

Anda dapat menyesuaikan:

  • Posisi: Tengah bawah atau tengah atas
  • Ukuran font: 16px hingga 48px (default 24px)
  • Bahasa: Subtitle cocok dengan bahasa tujuan

Subtitle berfungsi secara independen dari sulih suara. Anda dapat menjalankan subtitle saja di beberapa tujuan dan sulih suara penuh di tujuan lain. Anda bahkan dapat menjalankan keduanya — audio yang disulihsuarakan dengan subtitle yang cocok — untuk aksesibilitas maksimum.

Pencampuran Audio

Saat sulih suara aktif, StreamFluent secara otomatis menangani pencampuran audio:

  • Volume audio asli: Default ke 20% (suara asli Anda menjadi latar belakang yang halus, mempertahankan suara streaming alami)
  • Volume audio yang disulihsuarakan: Default ke 100%
  • Auto-ducking: Saat suara yang disulihsuarakan berbicara, audio asli secara otomatis diturunkan. Saat ada keheningan (audio gameplay saja, tanpa ucapan), audio asli kembali naik.

Semua ini dapat disesuaikan per streaming dari dasbor.


Dibangun untuk Keandalan: Apa yang Terjadi Saat Terjadi Kesalahan

Live streaming tidak kenal ampun. Jika ada yang rusak, tidak ada "urungkan". Kami membangun StreamFluent dengan realitas ini sebagai inti dari setiap keputusan arsitektur.

Mode Latensi

Kasus penggunaan yang berbeda menuntut tradeoff kualitas-latensi yang berbeda. StreamFluent menawarkan tiga mode:

  • Latensi Sangat Rendah (< 500ms): Untuk game kompetitif dan interaksi serba cepat. Tersedia di paket Bisnis.
  • Seimbang (< 1 detik): Default yang direkomendasikan untuk sebagian besar streamer. Tersedia di Pro dan Bisnis.
  • Kualitas (< 2 detik): Memprioritaskan akurasi terjemahan daripada kecepatan. Terbaik untuk konten yang banyak bicara.

Perilaku Fallback

Jika alur AI mengalami masalah di tengah streaming — gangguan jaringan singkat, penundaan pemrosesan sesaat — StreamFluent tidak hanya mogok atau menjadi sunyi. Anda mengonfigurasi apa yang terjadi:

  • Lewat (default): Audio asli yang tidak diterjemahkan dikeluarkan hingga alur pulih. Audiens Anda mendengar Anda dalam bahasa asli Anda untuk sesaat, lalu sulih suara dilanjutkan dengan mulus.
  • Bisukan: Trek audio yang disulihsuarakan menjadi sunyi sebentar. Berguna jika Anda lebih suka diam daripada audio yang tidak diterjemahkan.
  • Tampilkan Overlay: Pesan singkat di layar menunjukkan bahwa terjemahan untuk sementara tidak tersedia.

Dasbor Pemantauan Langsung

Saat Anda melakukan siaran langsung, dasbor StreamFluent memberi Anda pusat komando real-time:

  • Status per tujuan: Lihat apakah setiap keluaran bahasa sehat, bersama dengan jumlah pemirsa dan latensi
  • Level audio: Meteran visual untuk setiap aliran keluaran
  • Umpan transkripsi langsung: Tonton transkrip real-time dalam setiap bahasa, dengan tab untuk beralih di antara mereka
  • Pratinjau TTS: Dengarkan audio yang disulihsuarakan langsung di browser Anda untuk memverifikasi kualitas
  • Kontrol tengah streaming: Aktifkan atau nonaktifkan tujuan individual tanpa menghentikan streaming Anda

Visinya: Dunia di Mana Setiap Streamer Memiliki Audiens Global

Kami memulai StreamFluent karena kami percaya bahasa seharusnya tidak menentukan batas seorang kreator.

Internet seharusnya tanpa batas. Dan dalam banyak hal, memang demikian — Anda dapat menonton streaming dari mana saja di dunia, secara instan. Tetapi "menonton" dan "memahami" adalah dua hal yang sangat berbeda. Seorang pemirsa di Seoul mungkin secara teknis dapat memuat saluran Twitch Brasil, tetapi jika mereka tidak dapat memahami sepatah kata pun yang diucapkan, mereka akan pergi dalam hitungan detik.

Ini menciptakan segregasi yang tidak terlihat. Dunia streaming terpecah menjadi silo bahasa, dan kreator terjebak di dalamnya. Seorang penghibur brilian di Mexico City tidak akan pernah secara organik menjangkau pasar Jepang. Seorang streamer variasi Korea dengan 100.000 pengikut setia tidak memiliki jalan ke audiens berbahasa Inggris yang 10x lebih besar.

StreamFluent adalah jembatan.

Kami membayangkan masa depan di mana:

  • Seorang streamer di Buenos Aires melakukan siaran langsung dan secara bersamaan menghibur audiens di Tokyo, Berlin, Mumbai, dan Los Angeles — semuanya mendengar streaming dalam bahasa mereka sendiri, dengan suara yang terdengar seperti suara kreator.
  • Bahasa bukan lagi variabel dalam algoritma penemuan. Kualitas konten adalah yang terpenting.
  • Kelas menengah kreator berkembang secara global, karena bakat didistribusikan secara merata di seluruh bahasa tetapi peluang tidak lagi harus demikian.
  • Komunitas multibahasa terbentuk di sekitar kreator, dengan terjemahan obrolan dan interaksi lintas bahasa sebagai fitur asli (ya, kami juga sedang mengerjakannya).

Ini adalah visi yang besar. Kami belum sampai di sana. Tetapi dengan peluncuran hari ini, fondasinya sudah ada.


Harga: Mulai Gratis, Tingkatkan Saat Anda Berkembang

Kami merancang harga StreamFluent agar dapat diakses oleh kreator di setiap tingkatan.

Paket Gratis — $0/bulan

  • 30 menit subtitle dan 15 menit sulih suara per bulan
  • 1 bahasa target
  • Suara TTS standar
  • Akses penuh ke dasbor pemantauan langsung
  • Tidak diperlukan kartu kredit

Streaming 1 jam yang khas menggunakan sekitar 30 menit waktu subtitle dan 35 menit waktu sulih suara (kami mengukur waktu pemrosesan ucapan aktual, bukan waktu dinding — jadi jeda, segmen khusus gameplay, dan keheningan tidak dihitung). Paket Gratis memberi Anda cukup untuk menguji streaming penuh dan mengalami kualitas secara langsung.

Paket Pro — $29/bulan

  • 600 menit subtitle dan 300 menit sulih suara per bulan (~20 jam streaming)
  • Hingga 3 bahasa target
  • Model suara khusus dari sampel 30 detik
  • Distribusi relay RTMP ke beberapa platform
  • Kontrol pencampuran audio
  • Batas pengeluaran yang dapat dikonfigurasi untuk kelebihan
  • Uji coba gratis 14 hari

Paket Bisnis — $79/bulan

  • Menit subtitle tidak terbatas dan 1.200 menit sulih suara per bulan (~80 jam streaming)
  • Bahasa target tidak terbatas
  • Mode latensi sangat rendah (< 500ms)
  • Penyetelan suara tingkat lanjut
  • Replikasi suara dengan pelestarian emosi (segera hadir)
  • Dukungan prioritas

Perusahaan — Harga Kustom

  • Semuanya tidak terbatas
  • Infrastruktur relay khusus
  • Integrasi API khusus
  • Jaminan SLA
  • Opsi label putih

Semua paket berbayar menggunakan pengukuran presisi — kami hanya menghitung detik di mana AI kami benar-benar melakukan pekerjaan. Jika Anda diam-diam bermain game selama 10 menit, itu 0 menit subtitle dan 0 menit sulih suara. Anda membayar untuk apa yang Anda gunakan, dan tidak lebih.

Paket berbayar juga menyertakan batas pengeluaran yang dapat dikonfigurasi sehingga Anda tidak pernah terkejut dengan biaya kelebihan. Atur ke $0 untuk menghentikan secara paksa pada menit yang disertakan, atau hapus batas sepenuhnya untuk streaming tanpa gangguan.


Coba Hari Ini

StreamFluent sudah aktif. Tingkat gratis tersedia sekarang di streamfluent.ai. Tidak ada kartu kredit. Tidak ada komitmen. Cukup mendaftar, menempel URL RTMP ke OBS, dan melakukan streaming ke dunia.

Jika Anda seorang kreator yang pernah bertanya-tanya seperti apa audiens Anda tanpa hambatan bahasa — ini adalah jawaban Anda.

Jika Anda seorang pemirsa yang pernah mengklik keluar dari streaming luar biasa karena Anda tidak dapat memahami bahasanya — hari-hari itu sudah dihitung.

Kami membangun StreamFluent karena kami percaya konten terbaik harus menang, terlepas dari bahasa apa pun. Dan mulai hari ini, itu bisa.

Suara Anda. Setiap bahasa. Mari kita mulai.

Mulai Sulih Suara Gratis →


StreamFluent mendukung Twitch, YouTube, Kick, dan platform yang kompatibel dengan RTMP apa pun. Saat ini tersedia dalam 15 bahasa dengan lebih banyak lagi yang ditambahkan secara teratur. Pertanyaan? Hubungi kami di support@streamfluent.ai atau periksa dokumentasi kami.

Comments

Not displayed publicly