Kembali ke Blog

Memperkenalkan StreamFluent: Terjemahan Suara AI Masa Nyata Pertama di Dunia untuk Penstrim Langsung Kini Tersedia

S

StreamFluent

16 Februari 202614 minit baca0 tontonan
Memperkenalkan StreamFluent: Terjemahan Suara AI Masa Nyata Pertama di Dunia untuk Penstrim Langsung Kini Tersedia

Pada masa ini, di suatu tempat di Twitch, seorang penstrim di São Paulo sedang melakukan salah satu larian pantas yang paling mengagumkan yang pernah dilihat di internet. Ulasan mereka sangat menarik. Ruang sembang mereka meletup. Mereka mempunyai 8,000 penonton serentak dan setiap seorang daripada mereka bertutur dalam bahasa Portugis.

Di seberang planet ini, penonton berbahasa Inggeris yang berjumlah jutaan tidak akan tahu penstrim ini wujud. Bukan kerana kandungan itu tidak cukup bagus. Bukan kerana permainan itu tidak ada. Tetapi kerana satu tembok halimunan yang telah menentukan sempadan hiburan dalam talian sejak kamera web pertama disiarkan secara langsung: bahasa.

Hari ini, kami merobohkan tembok itu.

StreamFluent ialah platform alih suara dan kapsyen AI masa nyata pertama di dunia yang dibina khusus untuk penstrim langsung. Anda menstrim sekali, dalam bahasa ibunda anda. StreamFluent mendengar, mentranskripsi, menterjemah dan menyuarakan semula strim anda — dalam sehingga 15+ bahasa — setiap satu dihantar ke salurannya sendiri di Twitch, YouTube, Kick, atau mana-mana platform yang serasi dengan RTMP.

Ini bukan alih suara pasca-produksi. Ini bukan sari kata yang anda tambahkan selepas VOD dimuat naik. Ini berlaku secara langsung, dalam kependaman sub-saat, semasa anda bermain permainan, memberi reaksi atau bersembang dengan penonton anda.

Mari kami terangkan bagaimana kami sampai ke sini, apa yang kami bina dan mengapa kami percaya ini mengubah segala-galanya untuk pencipta.


Masalah: Bahasa Adalah Penghalang Terakhir dalam Penstriman Langsung

Industri penstriman telah menyelesaikan hampir semua masalah pengedaran yang lain. Anda boleh bersiaran langsung dari bilik tidur anda dan menjangkau penonton di setiap benua. Platform mempunyai CDN global yang menghantar video dalam milisaat. Algoritma penemuan memaparkan kandungan kepada khalayak baharu sepanjang masa. Sistem pembayaran membolehkan peminat di Tokyo memberi tip kepada pencipta di Toronto.

Tetapi bahasa? Bahasa masih menjadi tembok yang sukar.

Pertimbangkan matematik. Terdapat kira-kira 2.5 juta penstrim aktif di Twitch sahaja. Kebanyakan daripada mereka menstrim dalam satu bahasa. Bahasa Inggeris menguasai platform Barat, tetapi komuniti penstriman yang paling pesat berkembang adalah dalam Bahasa Sepanyol, Portugis, Jepun, Korea dan Hindi. Penonton ini sangat besar, terlibat dan sebahagian besarnya terpencil antara satu sama lain.

Seorang penstrim berbahasa Sepanyol dengan permainan yang luar biasa dan personaliti yang menarik mencapai had apabila bakal penonton mereka tidak bertutur dalam bahasa Sepanyol. Perkara yang sama berlaku sebaliknya — seorang pencipta Inggeris dengan komuniti setia seramai 50,000 pada dasarnya tidak mempunyai jangkauan ke dalam internet berbahasa Jepun yang kuat seramai 500 juta.

Ini bukan masalah kecil. Ia adalah tuil pertumbuhan yang belum diterokai terbesar dalam seluruh ekonomi pencipta. Dan sehingga kini, penyelesaiannya sama ada tidak wujud atau tidak praktikal yang menggelikan:

  • Terjemahan manual? Anda memerlukan jurubahasa manusia dalam panggilan suara, secara langsung, untuk setiap strim, dalam setiap bahasa. Kos sahaja sudah terlalu mahal. Kependaman menjadikannya tidak boleh ditonton.
  • Sari kata pasca-strim? Lebih baik daripada tiada untuk VOD, tetapi ia tidak melakukan apa-apa untuk tontonan langsung — di situlah terletaknya wang, komuniti dan momentum.
  • Lapisan kapsyen berasaskan pelayar? Segelintir alat wujud, tetapi ia hanya mengendalikan kapsyen teks, memerlukan persediaan pemalam OBS yang kompleks dan tidak menyelesaikan masalah asas: suara anda masih dalam satu bahasa.

Dunia penstriman memerlukan sesuatu yang baharu sepenuhnya. Sistem yang boleh memproses pertuturan, menterjemahkannya dan mensintesis suara baharu — semuanya dalam masa nyata, semuanya tanpa penstrim mengubah aliran kerja mereka.

Itulah yang kami bina.


Apa Yang Kami Bina: Alih Suara AI Masa Nyata untuk Strim Langsung

StreamFluent ialah saluran AI masa nyata yang terletak di antara pengekod penstriman anda (OBS Studio, Streamlabs atau mana-mana perisian yang serasi dengan RTMP) dan platform destinasi anda. Inilah yang berlaku apabila anda bersiaran langsung:

  1. Anda menstrim seperti biasa dalam bahasa ibunda anda. Tiada apa-apa tentang persediaan anda yang berubah kecuali URL destinasi RTMP dalam OBS.
  2. StreamFluent memasukkan strim anda melalui pelayan geganti RTMP kami. Video anda melalui tanpa disentuh — kami tidak pernah mengekod semula video anda.
  3. Saluran AI kami memproses audio anda dalam masa nyata: pengecaman pertuturan mentranskripsi apa yang anda katakan, terjemahan mesin menukarkannya ke dalam bahasa sasaran anda dan teks-ke-pertuturan saraf mensintesis trek suara baharu untuk setiap bahasa.
  4. Setiap strim yang diterjemahkan dihantar ke destinasinya sendiri — saluran Twitch yang berasingan, strim YouTube atau saluran Kick — lengkap dengan trek audio yang dialih suara dan kapsyen terbakar pilihan.

Hasilnya: anda menstrim sekali. Penonton anda menonton dalam lima belas bahasa. Setiap versi kedengaran semula jadi, kekal segerak dan tiba dengan kependaman sub-saat.

Mari kita pecahkan setiap bahagian.

Pengecaman Pertuturan (STT)

Peringkat pertama saluran ialah pengecaman pertuturan automatik. Enjin STT StreamFluent memproses audio anda dalam masa nyata, menukar pertuturan kepada teks dengan ketepatan yang tinggi walaupun dalam persekitaran permainan yang bising. Kami telah mengoptimumkan khusus untuk kes penggunaan penstriman — ulasan bercakap pantas, audio permainan latar belakang, bunyi bertindih dan huru-hara umum siaran langsung.

Terjemahan Mesin

Sebaik sahaja kami mempunyai transkrip anda, lapisan terjemahan kami menukarkannya ke dalam bahasa sasaran yang anda konfigurasikan. Kami kini menyokong 15 bahasa: Sepanyol, Jepun, Portugis, Perancis, Jerman, Korea, Cina (Mandarin), Itali, Rusia, Arab, Hindi, Turki, Belanda, Poland dan Thai — dengan lebih banyak lagi dalam perjalanan.

Enjin terjemahan ditala untuk pertuturan perbualan dan tidak formal — cara penstrim bercakap sebenarnya — bukan output yang tegar dan formal yang anda akan dapat daripada penterjemah dokumen generik.

Teks-ke-Pertuturan Saraf (TTS)

Di sinilah keajaiban berlaku. StreamFluent bukan sahaja memaparkan teks yang diterjemahkan. Ia menyebutnya. Enjin TTS kami menjana suara yang kedengaran semula jadi dalam bahasa sasaran, disintesis dalam masa nyata.

Pada pelan Pro kami, anda boleh mencipta model suara tersuai daripada hanya sampel audio 30 saat. Sistem ini mempelajari ciri-ciri suara anda — nada, irama, tenaga — dan menggunakannya pada output yang diterjemahkan. Strim Sepanyol anda kedengaran seperti anda bercakap bahasa Sepanyol, bukan robot generik.

Pada pelan Perniagaan kami, kami melancarkan replikasi suara penuh dengan pemeliharaan emosi — suara yang dialih suara akan membawa keterujaan, kekecewaan dan jenaka anda merentasi bahasa. (Ciri ini akan datang tidak lama lagi, dan penguji awal telah menggelarnya "aneh".)

Laluan Video

Keputusan reka bentuk yang kritikal: kami tidak pernah mengekod semula video anda. Strim 1080p60 atau 4K anda melalui pelayan geganti kami bit demi bit. Kami hanya menyentuh trek audio (dan secara pilihan membakar lapisan kapsyen). Ini bermakna tiada kehilangan kualiti, kependaman tambahan yang minimum dan tiada kos GPU tambahan pada pihak anda.


Cara Ia Berfungsi: Persediaan Dalam Kurang Daripada 2 Minit

Kami terobsesi untuk menjadikan StreamFluent sangat mudah untuk disediakan. Tiada pemalam untuk dipasang, tiada kabel audio maya untuk dikonfigurasikan, tiada sumber pelayar untuk bergelut. Berikut ialah keseluruhan aliran:

Langkah 1: Cipta Akaun Anda

Daftar di streamfluent.ai dengan e-mel anda atau sambung terus dengan akaun Twitch, YouTube atau Google anda. Tingkat percuma tersedia serta-merta — tiada kad kredit diperlukan.

Langkah 2: Sediakan Suara Anda

Untuk pengguna Pro dan Perniagaan, rakam sampel suara 30 saat terus dalam papan pemuka. Sistem kami menggunakan ini untuk membina profil suara tersuai anda. Anda boleh melaraskan kadar pertuturan (0.5x hingga 2.0x) dan pic (-12 hingga +12 semiton) untuk memperhalusi cara suara alih suara anda kedengaran.

Pengguna tingkat percuma mendapat akses kepada suara TTS standard berkualiti tinggi kami — masih kedengaran semula jadi, cuma tidak diperibadikan kepada suara khusus anda.

Langkah 3: Tambah Destinasi Anda

Di sinilah anda mengkonfigurasi ke mana setiap bahasa pergi. Untuk setiap bahasa sasaran, anda menentukan:

  • Bahasa (cth., Sepanyol, Jepun)
  • Platform (Twitch, YouTube, Kick atau mana-mana URL RTMP tersuai)
  • Kunci strim untuk saluran itu
  • Mod alih suara: alih suara AI penuh, kapsyen sahaja atau kedua-duanya

Anda boleh menjalankan seberapa banyak destinasi yang dibenarkan oleh pelan anda — satu pada tingkat Percuma, sehingga tiga pada Pro dan tanpa had pada Perniagaan.

Langkah 4: Sambungkan OBS dan Bersiar Langsung

Inilah bahagian yang mengejutkan semua orang: anda hanya menukar URL strim anda dalam OBS. Itu sahaja.

Pergi ke OBS Studio → Tetapan → Strim → pilih "Tersuai..." → tampal URL RTMP StreamFluent anda dan kunci strim. Ini dijana secara automatik dalam papan pemuka anda.

Pelayan: rtmp://ingest.streamfluent.ai/live
Kunci Strim: (kunci unik anda daripada papan pemuka)

Tekan "Mula Menstrim" dalam OBS. StreamFluent mengambil alih dari situ. Strim asal anda pergi ke saluran utama anda (jika anda telah mengkonfigurasi destinasi laluan), dan setiap versi yang diterjemahkan pergi ke saluran platform masing-masing.

Tiada pemalam. Tiada pemacu audio maya. Tiada sumber pelayar. Jika pengekod anda boleh mengeluarkan RTMP — dan hampir kesemuanya boleh — ia berfungsi dengan StreamFluent.


Kapsyen dan Alih Suara: Kawalan Penuh, Setiap Destinasi

Salah satu ciri yang paling banyak diminta semasa beta kami ialah kawalan terperinci ke atas kapsyen dan alih suara berdasarkan setiap destinasi. Penonton yang berbeza mempunyai pilihan yang berbeza, dan kami ingin memberi penstrim fleksibiliti yang lengkap.

Inilah cara ia berfungsi:

Mod Alih Suara

Setiap destinasi boleh ditetapkan kepada salah satu daripada tiga mod:

  • Alih Suara Auto: Jika bahasa destinasi berbeza daripada bahasa sumber anda, alih suara suara AI penuh digunakan. Ini adalah lalai dan tetapan yang paling biasa.
  • Kapsyen Sahaja: Suara asal anda dipelihara, tetapi kapsyen yang diterjemahkan dibakar ke dalam video. Hebat untuk penonton yang lebih suka mendengar suara asal tetapi memerlukan bantuan terjemahan.
  • Asal Sahaja: Strim melalui tanpa alih suara dan tanpa kapsyen. Berguna untuk destinasi bahasa "rumah" anda.

Kapsyen Terbakar

Sistem kapsyen StreamFluent memaparkan teks yang diterjemahkan terus ke dalam suapan video — tiada sambungan atau tetapan bahagian penonton diperlukan. Semua orang yang menonton melihat kapsyen, tanpa mengira peranti atau platform mereka.

Anda boleh menyesuaikan:

  • Kedudukan: Tengah bawah atau tengah atas
  • Saiz fon: 16px hingga 48px (lalai 24px)
  • Bahasa: Kapsyen sepadan dengan bahasa destinasi

Kapsyen berfungsi secara bebas daripada alih suara. Anda boleh menjalankan kapsyen sahaja pada beberapa destinasi dan alih suara penuh pada yang lain. Anda juga boleh menjalankan kedua-duanya — audio yang dialih suara dengan kapsyen yang sepadan — untuk kebolehaksesan maksimum.

Campuran Audio

Apabila alih suara aktif, StreamFluent mengendalikan campuran audio secara automatik:

  • Kelantangan audio asal: Lalai kepada 20% (suara asal anda menjadi latar belakang yang halus, mengekalkan bunyi strim semula jadi)
  • Kelantangan audio yang dialih suara: Lalai kepada 100%
  • Auto-ducking: Apabila suara yang dialih suara bercakap, audio asal diturunkan secara automatik. Apabila terdapat kesenyapan (audio permainan sahaja, tiada pertuturan), audio asal kembali naik.

Semua ini boleh dilaraskan setiap strim daripada papan pemuka.


Dibina untuk Kebolehpercayaan: Apa Yang Berlaku Apabila Perkara Tidak Kena

Penstriman langsung tidak memaafkan. Jika sesuatu rosak, tiada "buat asal." Kami membina StreamFluent dengan realiti ini sebagai teras setiap keputusan seni bina.

Mod Kependaman

Kes penggunaan yang berbeza memerlukan pertukaran kualiti kependaman yang berbeza. StreamFluent menawarkan tiga mod:

  • Kependaman Ultra Rendah (< 500ms): Untuk permainan kompetitif dan interaksi pantas. Tersedia pada pelan Perniagaan.
  • Seimbang (< 1 saat): Lalai yang disyorkan untuk kebanyakan penstrim. Tersedia pada Pro dan Perniagaan.
  • Kualiti (< 2 saat): Mengutamakan ketepatan terjemahan berbanding kelajuan. Terbaik untuk kandungan yang banyak bercakap.

Gelagat Sandaran

Jika saluran AI menghadapi isu di tengah-tengah strim — gangguan rangkaian yang singkat, kelewatan pemprosesan seketika — StreamFluent tidak hanya ranap atau menjadi senyap. Anda mengkonfigurasi apa yang berlaku:

  • Laluan (lalai): Audio asal yang tidak diterjemahkan dikeluarkan sehingga saluran pulih. Penonton anda mendengar anda dalam bahasa ibunda anda seketika, kemudian alih suara disambung semula dengan lancar.
  • Redam: Trek audio yang dialih suara menjadi senyap seketika. Berguna jika anda lebih suka senyap daripada audio yang tidak diterjemahkan.
  • Tunjukkan Lapisan: Mesej ringkas pada skrin menunjukkan bahawa terjemahan tidak tersedia buat sementara waktu.

Papan Pemuka Pemantauan Langsung

Semasa anda bersiaran langsung, papan pemuka StreamFluent memberi anda pusat arahan masa nyata:

  • Status setiap destinasi: Lihat sama ada setiap output bahasa sihat, bersama-sama dengan kiraan penonton dan kependaman
  • Tahap audio: Meter visual untuk setiap strim output
  • Suapan transkripsi langsung: Tonton transkrip masa nyata dalam setiap bahasa, dengan tab untuk bertukar antara mereka
  • Pratonton TTS: Dengar audio yang dialih suara terus dalam pelayar anda untuk mengesahkan kualiti
  • Kawalan tengah-strim: Dayakan atau lumpuhkan destinasi individu tanpa menghentikan strim anda

Visi: Dunia Di Mana Setiap Penstrim Mempunyai Penonton Global

Kami memulakan StreamFluent kerana kami percaya bahasa tidak seharusnya menentukan had pencipta.

Internet sepatutnya tanpa sempadan. Dan dalam banyak cara, ia adalah — anda boleh menonton strim dari mana-mana sahaja di dunia, serta-merta. Tetapi "menonton" dan "memahami" adalah dua perkara yang sangat berbeza. Seorang penonton di Seoul mungkin secara teknikalnya dapat memuatkan saluran Twitch Brazil, tetapi jika mereka tidak dapat memahami sepatah perkataan yang diucapkan, mereka akan pergi dalam beberapa saat.

Ini mewujudkan pengasingan yang tidak kelihatan. Dunia penstriman dipecah menjadi silo bahasa, dan pencipta terperangkap di dalamnya. Seorang penghibur yang cemerlang di Mexico City tidak akan pernah mencapai pasaran Jepun secara organik. Seorang penstrim variasi Korea dengan 100,000 pengikut setia tidak mempunyai laluan ke penonton berbahasa Inggeris yang 10x lebih besar.

StreamFluent ialah jambatan.

Kami membayangkan masa depan di mana:

  • Seorang penstrim di Buenos Aires bersiaran langsung dan serentak menghiburkan penonton di Tokyo, Berlin, Mumbai dan Los Angeles — semuanya mendengar strim dalam bahasa mereka sendiri, dalam suara yang kedengaran seperti pencipta.
  • Bahasa bukan lagi pemboleh ubah dalam algoritma penemuan. Kualiti kandungan adalah yang penting.
  • Kelas pertengahan pencipta berkembang secara global, kerana bakat diagihkan secara sama rata merentasi bahasa tetapi peluang tidak lagi perlu.
  • Komuniti berbilang bahasa terbentuk di sekeliling pencipta, dengan terjemahan sembang dan interaksi rentas bahasa sebagai ciri asli (ya, kami juga sedang mengusahakan itu).

Ini adalah visi yang besar. Kami belum sampai ke sana lagi. Tetapi dengan pelancaran hari ini, asasnya sudah tersedia.


Harga: Mulakan Percuma, Skala Semasa Anda Berkembang

Kami mereka bentuk harga StreamFluent agar boleh diakses oleh pencipta di setiap peringkat.

Pelan Percuma — $0/bulan

  • 30 minit kapsyen dan 15 minit alih suara setiap bulan
  • 1 bahasa sasaran
  • Suara TTS standard
  • Akses penuh ke papan pemuka pemantauan langsung
  • Tiada kad kredit diperlukan

Strim 1 jam biasa menggunakan kira-kira 30 minit masa kapsyen dan 35 minit masa alih suara (kami mengukur masa pemprosesan pertuturan sebenar, bukan masa jam dinding — jadi jeda, segmen permainan sahaja dan kesenyapan tidak dikira). Pelan Percuma memberi anda cukup untuk menguji strim penuh dan mengalami kualiti secara langsung.

Pelan Pro — $29/bulan

  • 600 minit kapsyen dan 300 minit alih suara setiap bulan (~20 jam penstriman)
  • Sehingga 3 bahasa sasaran
  • Model suara tersuai daripada sampel 30 saat
  • Pengedaran geganti RTMP ke berbilang platform
  • Kawalan campuran audio
  • Had perbelanjaan boleh dikonfigurasi untuk lebihan
  • Percubaan percuma 14 hari

Pelan Perniagaan — $79/bulan

  • Minit kapsyen tanpa had dan 1,200 minit alih suara setiap bulan (~80 jam penstriman)
  • Bahasa sasaran tanpa had
  • Mod kependaman ultra rendah (< 500ms)
  • Penalaan suara lanjutan
  • Replikasi suara dengan pemeliharaan emosi (akan datang tidak lama lagi)
  • Sokongan keutamaan

Perusahaan — Harga Tersuai

  • Segala-galanya tanpa had
  • Infrastruktur geganti khusus
  • Integrasi API tersuai
  • Jaminan SLA
  • Pilihan label putih

Semua pelan berbayar menggunakan pengukuran ketepatan — kami hanya mengira saat di mana AI kami benar-benar melakukan kerja. Jika anda bermain permainan secara senyap selama 10 minit, itu ialah 0 minit kapsyen dan 0 minit alih suara. Anda membayar untuk apa yang anda gunakan, dan tiada apa-apa lagi.

Pelan berbayar juga termasuk had perbelanjaan boleh dikonfigurasi supaya anda tidak pernah terkejut dengan caj lebihan. Tetapkan kepada $0 untuk berhenti keras pada minit yang disertakan, atau alih keluar had sepenuhnya untuk penstriman tanpa gangguan.


Cuba Hari Ini

StreamFluent sedang bersiaran langsung. Tingkat percuma tersedia sekarang di streamfluent.ai. Tiada kad kredit. Tiada komitmen. Hanya daftar, tampal URL RTMP ke dalam OBS dan strim ke dunia.

Jika anda seorang pencipta yang pernah tertanya-tanya bagaimana rupa penonton anda tanpa halangan bahasa — ini adalah jawapan anda.

Jika anda seorang penonton yang pernah mengklik keluar daripada strim yang luar biasa kerana anda tidak dapat memahami bahasa itu — hari-hari itu sudah terhitung.

Kami membina StreamFluent kerana kami percaya kandungan terbaik harus menang, tanpa mengira bahasa apa yang digunakan. Dan bermula hari ini, ia boleh.

Suara anda. Setiap bahasa. Mari pergi.

Mula Mengalih Suara Percuma →


StreamFluent menyokong Twitch, YouTube, Kick dan mana-mana platform yang serasi dengan RTMP. Pada masa ini tersedia dalam 15 bahasa dengan lebih banyak lagi ditambah dengan kerap. Soalan? Hubungi kami di support@streamfluent.ai atau semak dokumentasi kami.

Comments

Not displayed publicly