StreamFluent: První AI hlasový překlad v reálném čase pro live streamery na světě je spuštěn
StreamFluent

Právě teď někde na Twitchi streamer v São Paulu předvádí jeden z nejpůsobivějších speedrunů, jaké kdy internet viděl. Jeho komentář je elektrizující. Jeho chat exploduje. Má 8 000 současných diváků a každý z nich mluví portugalsky.
Na druhé straně planety se anglicky mluvící publikum o milionech nikdy nedozví, že tento streamer existuje. Ne proto, že by obsah nebyl dost dobrý. Ne proto, že by gameplay nebyl na úrovni. Ale kvůli jediné, neviditelné zdi, která definovala hranice online zábavy od doby, kdy se objevila první webkamera: jazyk.
Dnes tuto zeď boříme.
StreamFluent je první platforma na světě pro dabing a titulkování v reálném čase pomocí umělé inteligence, vytvořená speciálně pro živé streamery. Streamujete jednou, ve svém rodném jazyce. StreamFluent poslouchá, přepisuje, překládá a předabovává váš stream – do více než 15 jazyků – každý doručený na svůj vlastní kanál na Twitchi, YouTube, Kicku nebo jakékoli platformě kompatibilní s RTMP.
Toto není postprodukční dabing. Toto nejsou titulky, které přidáváte po nahrání VOD. Toto se děje živě, s latencí pod sekundu, zatímco hrajete, reagujete nebo chatujete se svým publikem.
Dovolte nám vysvětlit, jak jsme se sem dostali, co jsme vytvořili a proč věříme, že to pro tvůrce všechno mění.
Problém: Jazyk je poslední bariérou v živém streamování
Streamovací průmysl vyřešil téměř všechny ostatní distribuční problémy. Můžete vysílat živě ze své ložnice a oslovit diváky na všech kontinentech. Platformy mají globální CDN, které doručují video v milisekundách. Algoritmy objevování zobrazují obsah novému publiku nepřetržitě. Platební systémy umožňují fanouškům v Tokiu posílat spropitné tvůrci v Torontu.
Ale jazyk? Jazyk je stále tvrdá zeď.
Zvažte matematiku. Jen na Twitchi je zhruba 2,5 milionu aktivních streamerů. Drtivá většina z nich streamuje v jednom jazyce. Angličtina dominuje západním platformám, ale nejrychleji rostoucí streamovací komunity jsou ve španělštině, portugalštině, japonštině, korejštině a hindštině. Toto publikum je obrovské, angažované a z velké části oddělené jedno od druhého.
Španělsky mluvící streamer s neuvěřitelným gameplayem a magnetickou osobností narazí na strop ve chvíli, kdy jeho potenciální divák nemluví španělsky. Totéž platí i naopak – anglický tvůrce s loajální komunitou 50 000 lidí má v podstatě nulový dosah do 500 milionů uživatelů internetu mluvících japonsky.
Toto není malý problém. Je to jediná největší nevyužitá páka růstu v celém tvůrčím hospodářství. A až dosud byla řešení buď neexistující, nebo směšně nepraktická:
- Manuální překlad? Potřebovali byste lidského tlumočníka na hlasovém hovoru, živě, pro každý stream, v každém jazyce. Samotné náklady jsou neúnosné. Latence to činí nesledovatelným.
- Titulky po streamu? Lepší než nic pro VOD, ale nedělají nic pro živé sledování – kde jsou peníze, komunita a momentum.
- Překryvné titulky založené na prohlížeči? Existuje hrstka nástrojů, ale ty se zabývají pouze textovými titulky, vyžadují složité nastavení pluginů OBS a neřeší zásadní problém: váš hlas je stále v jednom jazyce.
Streamovací svět potřeboval něco zcela nového. Systém, který by dokázal zpracovat řeč, přeložit ji a syntetizovat nový hlas – vše v reálném čase, vše bez toho, aby streamer měnil svůj pracovní postup.
To je to, co jsme vytvořili.
Co jsme vytvořili: Dabing v reálném čase pomocí umělé inteligence pro živé streamy
StreamFluent je AI pipeline v reálném čase, která sedí mezi vaším streamovacím enkodérem (OBS Studio, Streamlabs nebo jakýkoli software kompatibilní s RTMP) a vašimi cílovými platformami. Zde je to, co se stane, když začnete vysílat živě:
- Streamujete normálně ve svém rodném jazyce. Na vašem nastavení se nic nemění kromě cílové adresy URL RTMP v OBS.
- StreamFluent přijímá váš stream prostřednictvím našich RTMP relay serverů. Vaše video prochází beze změny – nikdy vaše video znovu nekódujeme.
- Naše AI pipeline zpracovává váš zvuk v reálném čase: rozpoznávání řeči přepisuje to, co říkáte, strojový překlad to převádí do vašich cílových jazyků a neuronová syntéza textu na řeč syntetizuje novou zvukovou stopu pro každý jazyk.
- Každý přeložený stream je doručen do svého vlastního cíle – samostatný kanál Twitch, stream YouTube nebo kanál Kick – kompletní s dabovanou zvukovou stopou a volitelnými vypálenými titulky.
Výsledek: streamujete jednou. Vaše publikum sleduje v patnácti jazycích. Každá verze zní přirozeně, zůstává synchronizovaná a dorazí s latencí pod sekundu.
Pojďme si rozebrat každý díl.
Rozpoznávání řeči (STT)
První fází pipeline je automatické rozpoznávání řeči. STT engine StreamFluent zpracovává váš zvuk v reálném čase a převádí řeč na text s vysokou přesností i v hlučném herním prostředí. Optimalizovali jsme speciálně pro případ použití streamování – rychlé komentáře, zvuk na pozadí hry, překrývající se zvuky a obecný chaos živého vysílání.
Strojový překlad
Jakmile máme váš přepis, naše překladová vrstva jej převede do vašich nakonfigurovaných cílových jazyků. V současné době podporujeme 15 jazyků: španělštinu, japonštinu, portugalštinu, francouzštinu, němčinu, korejštinu, čínštinu (mandarínštinu), italštinu, ruštinu, arabštinu, hindštinu, turečtinu, holandštinu, polštinu a thajštinu – a další jsou na cestě.
Překladový engine je vyladěn pro konverzační, neformální řeč – způsob, jakým streameři skutečně mluví – nikoli pro strnulý, formální výstup, který byste získali z obecného překladače dokumentů.
Neuronová syntéza textu na řeč (TTS)
Tady se děje ta magie. StreamFluent nezobrazuje pouze přeložený text. On ho říká. Náš TTS engine generuje přirozeně znějící hlas v cílovém jazyce, syntetizovaný v reálném čase.
V našem Pro plánu si můžete vytvořit vlastní hlasový model pouze z 30sekundového zvukového vzorku. Systém se naučí charakteristiky vašeho hlasu – tón, kadenci, energii – a aplikuje je na přeložený výstup. Váš španělský stream zní jako vy, když mluvíte španělsky, ne jako generický robot.
V našem Business plánu zavádíme plnou replikaci hlasu se zachováním emocí – dabovaný hlas ponese vaše nadšení, frustraci a humor napříč jazyky. (Tato funkce se blíží a první testeři ji nazvali „děsivou“.)
Video Passthrough
Kritické rozhodnutí o designu: nikdy vaše video znovu nekódujeme. Váš stream 1080p60 nebo 4K prochází našimi relay servery bit po bitu. Dotýkáme se pouze zvukové stopy (a volitelně vypalujeme překryvné titulky). To znamená nulovou ztrátu kvality, minimální přidanou latenci a žádné další náklady na GPU na vaší straně.
Jak to funguje: Nastavení za méně než 2 minuty
Byli jsme posedlí tím, aby bylo nastavení StreamFluent směšně snadné. Neexistují žádné pluginy k instalaci, žádné virtuální audio kabely ke konfiguraci, žádné zdroje prohlížeče, se kterými byste se museli potýkat. Zde je celý postup:
Krok 1: Vytvořte si svůj účet
Zaregistrujte se na streamfluent.ai se svým e-mailem nebo se připojte přímo se svým účtem Twitch, YouTube nebo Google. Bezplatná úroveň je k dispozici okamžitě – není vyžadována žádná kreditní karta.
Krok 2: Nastavte si svůj hlas
Pro uživatele Pro a Business nahrajte 30sekundový hlasový vzorek přímo na palubní desce. Náš systém to používá k vytvoření vašeho vlastního hlasového profilu. Můžete upravit rychlost mluvení (0,5x až 2,0x) a výšku tónu (-12 až +12 půltónů) pro doladění toho, jak váš dabovaný hlas zní.
Uživatelé bezplatné úrovně získají přístup k našim vysoce kvalitním standardním TTS hlasům – stále znějí přirozeně, jen nejsou personalizované pro váš konkrétní hlas.
Krok 3: Přidejte své cíle
Zde konfigurujete, kam každý jazyk směřuje. Pro každý cílový jazyk určíte:
- Jazyk (např. španělština, japonština)
- Platformu (Twitch, YouTube, Kick nebo jakoukoli vlastní adresu URL RTMP)
- Streamovací klíč pro daný kanál
- Režim dabingu: plný dabing pomocí umělé inteligence, pouze titulky nebo obojí
Můžete spustit tolik cílů, kolik vám váš plán umožňuje – jeden na bezplatné úrovni, až tři na Pro a neomezeně na Business.
Krok 4: Připojte OBS a začněte vysílat živě
Zde je část, která všechny překvapí: stačí změnit adresu URL streamu v OBS. To je vše.
Přejděte do OBS Studio → Nastavení → Stream → vyberte „Vlastní...“ → vložte adresu URL RTMP StreamFluent a streamovací klíč. Ty se generují automaticky na vaší palubní desce.
Server: rtmp://ingest.streamfluent.ai/live
Streamovací klíč: (váš jedinečný klíč z palubní desky)
Stiskněte „Spustit streamování“ v OBS. StreamFluent to odtamtud převezme. Váš původní stream jde na váš hlavní kanál (pokud jste nakonfigurovali cílové místo pro průchod) a každá přeložená verze jde na svůj příslušný kanál platformy.
Žádné pluginy. Žádné virtuální audio ovladače. Žádné zdroje prohlížeče. Pokud váš enkodér dokáže vyvést RTMP – a prakticky všechny to dokážou – funguje to se StreamFluent.
Titulky a dabing: Plná kontrola, pro každý cíl
Jednou z nejžádanějších funkcí během naší beta verze byla podrobná kontrola nad titulky a dabingem pro každý cíl. Různé publikum má různé preference a my jsme chtěli streamerům poskytnout úplnou flexibilitu.
Funguje to takto:
Režimy dabingu
Každý cíl lze nastavit do jednoho ze tří režimů:
- Automatický dabing: Pokud se cílový jazyk liší od vašeho zdrojového jazyka, použije se plný dabing hlasem AI. Toto je výchozí a nejběžnější nastavení.
- Pouze titulky: Váš původní hlas je zachován, ale do videa jsou vypáleny přeložené titulky. Skvělé pro publikum, které raději slyší původní hlas, ale potřebuje pomoc s překladem.
- Pouze originál: Stream prochází bez dabingu a bez titulků. Užitečné pro váš „domácí“ jazykový cíl.
Vypálené titulky
Systém titulků StreamFluent vykresluje přeložený text přímo do video streamu – není vyžadováno žádné rozšíření na straně diváka ani nastavení. Každý, kdo sleduje, vidí titulky bez ohledu na své zařízení nebo platformu.
Můžete si přizpůsobit:
- Pozici: Dolní střed nebo horní střed
- Velikost písma: 16px až 48px (výchozí 24px)
- Jazyk: Titulky odpovídají cílovému jazyku
Titulky fungují nezávisle na dabingu. Můžete spouštět pouze titulky na některých cílech a plný dabing na jiných. Můžete dokonce spustit obojí – dabovaný zvuk s odpovídajícími titulky – pro maximální přístupnost.
Míchání zvuku
Když je dabing aktivní, StreamFluent automaticky zpracovává míchání zvuku:
- Původní hlasitost zvuku: Výchozí hodnota je 20 % (váš původní hlas se stane jemným pozadím, které zachovává přirozené zvuky streamu)
- Hlasitost dabovaného zvuku: Výchozí hodnota je 100 %
- Automatické ztlumení: Když mluví dabovaný hlas, původní zvuk se automaticky ztlumí. Když je ticho (pouze zvuk hry, žádná řeč), původní zvuk se vrátí.
Všechny tyto parametry jsou nastavitelné pro každý stream z palubní desky.
Vytvořeno pro spolehlivost: Co se stane, když se něco pokazí
Živé streamování je nemilosrdné. Pokud se něco pokazí, neexistuje žádné „zpět“. StreamFluent jsme vytvořili s touto realitou v jádru každého architektonického rozhodnutí.
Režimy latence
Různé případy použití vyžadují různé kompromisy mezi latencí a kvalitou. StreamFluent nabízí tři režimy:
- Ultra-nízká latence (< 500 ms): Pro soutěžní hraní a rychlou interakci. K dispozici v plánu Business.
- Vyvážený (< 1 sekunda): Doporučený výchozí pro většinu streamerů. K dispozici v Pro a Business.
- Kvalita (< 2 sekundy): Upřednostňuje přesnost překladu před rychlostí. Nejlepší pro obsah s velkým množstvím mluveného slova.
Chování při selhání
Pokud se AI pipeline setká s problémem uprostřed streamu – krátká síťová závada, krátkodobé zpoždění zpracování – StreamFluent se prostě nezhroutí nebo nezmlkne. Nakonfigurujete, co se stane:
- Průchod (výchozí): Původní, nepřeložený zvuk je vydáván, dokud se pipeline neobnoví. Vaše publikum vás na chvíli uslyší ve vašem rodném jazyce a poté dabing plynule pokračuje.
- Ztlumit: Dabovaná zvuková stopa na krátkou dobu zmlkne. Užitečné, pokud byste raději měli ticho než nepřeložený zvuk.
- Zobrazit překryv: Krátká zpráva na obrazovce indikuje, že překlad je dočasně nedostupný.
Palubní deska pro živé sledování
Zatímco jste živě, palubní deska StreamFluent vám poskytuje řídicí centrum v reálném čase:
- Stav pro každý cíl: Zjistěte, zda je výstup každého jazyka v pořádku, spolu s počtem diváků a latencí
- Úrovně zvuku: Vizuální měřiče pro každý výstupní stream
- Živý přepis: Sledujte přepis v reálném čase v každém jazyce, s kartami pro přepínání mezi nimi
- Náhled TTS: Poslechněte si dabovaný zvuk přímo ve svém prohlížeči a ověřte kvalitu
- Ovládací prvky uprostřed streamu: Povolte nebo zakažte jednotlivé cíle, aniž byste zastavili stream
Vize: Svět, kde má každý streamer globální publikum
StreamFluent jsme založili, protože věříme, že jazyk by neměl určovat strop tvůrce.
Internet měl být bez hranic. A v mnoha ohledech je – můžete sledovat stream odkudkoli na světě, okamžitě. Ale „sledovat“ a „rozumět“ jsou dvě velmi odlišné věci. Divák v Soulu si technicky může načíst brazilský kanál Twitch, ale pokud nerozumí ani slovo, odejde během několika sekund.
To vytváří neviditelnou segregaci. Streamovací svět je rozdělen na jazyková sila a tvůrci jsou v nich uvězněni. Brilantní bavič v Mexico City nikdy organicky neosloví japonský trh. Korejský varietní streamer se 100 000 věrnými sledujícími nemá žádnou cestu k anglicky mluvícímu publiku, které je 10x větší.
StreamFluent je most.
Představujeme si budoucnost, kde:
- Streamer v Buenos Aires začne vysílat živě a současně baví publikum v Tokiu, Berlíně, Bombaji a Los Angeles – všichni slyší stream ve svém vlastním jazyce, hlasem, který zní jako hlas tvůrce.
- Jazyk již není proměnnou v algoritmu objevování. Kvalita obsahu je vše, na čem záleží.
- Střední třída tvůrců se rozšiřuje globálně, protože talent je rovnoměrně rozložen napříč jazyky, ale příležitost už nemusí být.
- Kolem tvůrců se tvoří vícejazyčné komunity s překladem chatu a interakcí mezi jazyky jako nativní funkcí (ano, i na tom pracujeme).
Toto je velká vize. Ještě tam nejsme. Ale s dnešním spuštěním je základ na svém místě.
Ceny: Začněte zdarma, škálujte, jak rostete
Ceny StreamFluent jsme navrhli tak, aby byly dostupné tvůrcům na všech úrovních.
Bezplatný plán – 0 $/měsíc
- 30 minut titulků a 15 minut dabingu měsíčně
- 1 cílový jazyk
- Standardní TTS hlasy
- Plný přístup k palubní desce pro živé sledování
- Není vyžadována žádná kreditní karta
Typický 1hodinový stream využívá zhruba 30 minut času titulků a 35 minut času dabingu (měříme skutečný čas zpracování řeči, nikoli čas na hodinách – takže pauzy, segmenty pouze s hrou a ticho se nepočítají). Bezplatný plán vám poskytne dostatek na otestování celého streamu a vyzkoušení kvality na vlastní kůži.
Pro plán – 29 $/měsíc
- 600 minut titulků a 300 minut dabingu měsíčně (~20 hodin streamování)
- Až 3 cílové jazyky
- Vlastní hlasový model z 30sekundového vzorku
- Distribuce RTMP relay na více platforem
- Ovládací prvky pro míchání zvuku
- Konfigurovatelný limit útraty za překročení
- 14denní bezplatná zkušební verze
Business plán – 79 $/měsíc
- Neomezené minuty titulků a 1 200 minut dabingu měsíčně (~80 hodin streamování)
- Neomezené cílové jazyky
- Režim ultra-nízké latence (< 500 ms)
- Pokročilé ladění hlasu
- Replikace hlasu se zachováním emocí (již brzy)
- Prioritní podpora
Enterprise – Vlastní ceny
- Neomezené vše
- Vyhrazená relay infrastruktura
- Vlastní integrace API
- Záruky SLA
- Možnosti white-label
Všechny placené plány používají přesné měření – počítáme pouze sekundy, kdy naše AI skutečně pracuje. Pokud tiše hrajete 10 minut, je to 0 minut titulků a 0 minut dabingu. Platíte za to, co používáte, a nic víc.
Placené plány také zahrnují konfigurovatelný limit útraty, takže vás nikdy nepřekvapí poplatky za překročení. Nastavte jej na 0 $, abyste se tvrdě zastavili na zahrnutých minutách, nebo zcela odstraňte limit pro nepřerušované streamování.
Vyzkoušejte to ještě dnes
StreamFluent je živě. Bezplatná úroveň je k dispozici právě teď na streamfluent.ai. Žádná kreditní karta. Žádný závazek. Stačí se zaregistrovat, vložit adresu URL RTMP do OBS a streamovat do světa.
Pokud jste tvůrce, který se někdy zajímal o to, jak by mohlo vypadat vaše publikum bez jazykové bariéry – toto je vaše odpověď.
Pokud jste divák, který někdy kliknul pryč od neuvěřitelného streamu, protože jste nerozuměli jazyku – tyto dny jsou sečteny.
StreamFluent jsme vytvořili, protože věříme, že by měl vyhrát ten nejlepší obsah bez ohledu na to, v jakém jazyce je. A od dnešního dne to může.
Váš hlas. Každý jazyk. Jdeme na to.
StreamFluent podporuje Twitch, YouTube, Kick a jakoukoli platformu kompatibilní s RTMP. V současné době je k dispozici v 15 jazycích a další jsou pravidelně přidávány. Máte dotazy? Kontaktujte nás na support@streamfluent.ai nebo si prohlédněte naši dokumentaci.