Apresentando o StreamFluent: A Primeira Tradução de Voz por IA em Tempo Real do Mundo para Streamers Está no Ar
StreamFluent

Neste momento, em algum lugar na Twitch, um streamer em São Paulo está realizando um dos speedruns mais impressionantes que a internet já viu. Seus comentários são eletrizantes. Seu chat está explodindo. Eles têm 8.000 espectadores simultâneos e cada um deles fala português.
Do outro lado do planeta, um público de milhões de falantes de inglês nunca saberá que este streamer existe. Não porque o conteúdo não seja bom o suficiente. Não porque a jogabilidade não esteja lá. Mas por causa de uma única parede invisível que definiu os limites do entretenimento online desde que a primeira webcam foi ao ar: idioma.
Hoje, estamos derrubando essa parede.
StreamFluent é a primeira plataforma de legendagem e dublagem de voz com IA em tempo real do mundo, construída especificamente para streamers ao vivo. Você transmite uma vez, em seu idioma nativo. O StreamFluent ouve, transcreve, traduz e redubla sua transmissão — em até 15+ idiomas — cada um entregue ao seu próprio canal no Twitch, YouTube, Kick ou qualquer plataforma compatível com RTMP.
Esta não é uma dublagem de pós-produção. Estas não são legendas que você adiciona depois que um VOD é carregado. Isso está acontecendo ao vivo, em latência de sub-segundos, enquanto você está jogando, reagindo ou conversando com seu público.
Deixe-nos explicar como chegamos aqui, o que construímos e por que acreditamos que isso muda tudo para os criadores.
O Problema: O Idioma É a Última Barreira no Streaming Ao Vivo
A indústria de streaming resolveu quase todos os outros problemas de distribuição. Você pode entrar ao vivo do seu quarto e alcançar espectadores em todos os continentes. As plataformas têm CDNs globais que entregam vídeo em milissegundos. Os algoritmos de descoberta exibem conteúdo para novos públicos o tempo todo. Os sistemas de pagamento permitem que fãs em Tóquio deem gorjeta a um criador em Toronto.
Mas o idioma? O idioma ainda é uma barreira difícil.
Considere a matemática. Existem aproximadamente 2,5 milhões de streamers ativos apenas no Twitch. A grande maioria deles transmite em um único idioma. O inglês domina as plataformas ocidentais, mas as comunidades de streaming que mais crescem estão em espanhol, português, japonês, coreano e hindi. Esses públicos são enormes, engajados e amplamente isolados uns dos outros.
Um streamer de língua espanhola com jogabilidade incrível e uma personalidade magnética atinge um teto no momento em que seu potencial espectador não fala espanhol. O mesmo é verdade ao contrário — um criador de inglês com uma comunidade leal de 50.000 pessoas tem essencialmente alcance zero na internet de língua japonesa de 500 milhões de pessoas.
Este não é um problema pequeno. É a maior alavanca de crescimento inexplorada em toda a economia do criador. E até agora, as soluções têm sido inexistentes ou ridiculamente impraticáveis:
- Tradução manual? Você precisaria de um intérprete humano em uma chamada de voz, ao vivo, para cada transmissão, em cada idioma. O custo por si só é proibitivo. A latência torna impossível de assistir.
- Legendas pós-transmissão? Melhor do que nada para VODs, mas não fazem nada para a audiência ao vivo — que é onde estão o dinheiro, a comunidade e o ímpeto.
- Sobreposições de legendas baseadas em navegador? Existem algumas ferramentas, mas elas lidam apenas com legendas de texto, exigem configurações complexas de plugins OBS e não resolvem o problema fundamental: sua voz ainda está em um idioma.
O mundo do streaming precisava de algo totalmente novo. Um sistema que pudesse processar a fala, traduzi-la e sintetizar uma nova voz — tudo em tempo real, tudo sem que o streamer mudasse seu fluxo de trabalho.
Foi isso que construímos.
O Que Construímos: Dublagem de IA em Tempo Real para Transmissões Ao Vivo
StreamFluent é um pipeline de IA em tempo real que fica entre seu codificador de streaming (OBS Studio, Streamlabs ou qualquer software compatível com RTMP) e suas plataformas de destino. Veja o que acontece quando você entra ao vivo:
- Você transmite normalmente em seu idioma nativo. Nada sobre sua configuração muda, exceto o URL de destino RTMP no OBS.
- StreamFluent ingere sua transmissão por meio de nossos servidores de retransmissão RTMP. Seu vídeo passa intocado — nunca re-codificamos seu vídeo.
- Nosso pipeline de IA processa seu áudio em tempo real: o reconhecimento de fala transcreve o que você está dizendo, a tradução automática o converte em seus idiomas de destino e a conversão de texto em fala neural sintetiza uma nova faixa de voz para cada idioma.
- Cada transmissão traduzida é entregue ao seu próprio destino — um canal Twitch separado, transmissão do YouTube ou canal Kick — completo com a faixa de áudio dublada e legendas opcionais embutidas.
O resultado: você transmite uma vez. Seu público assiste em quinze idiomas. Cada versão soa natural, permanece sincronizada e chega com latência de sub-segundos.
Vamos detalhar cada peça.
Reconhecimento de Fala (STT)
O primeiro estágio do pipeline é o reconhecimento automático de fala. O mecanismo STT do StreamFluent processa seu áudio em tempo real, convertendo fala em texto com alta precisão, mesmo em ambientes de jogos ruidosos. Otimizamos especificamente para o caso de uso de streaming — comentários rápidos, áudio de jogo de fundo, sons sobrepostos e o caos geral de uma transmissão ao vivo.
Tradução Automática
Depois de termos sua transcrição, nossa camada de tradução a converte em seus idiomas de destino configurados. Atualmente, oferecemos suporte a 15 idiomas: espanhol, japonês, português, francês, alemão, coreano, chinês (mandarim), italiano, russo, árabe, hindi, turco, holandês, polonês e tailandês — com mais a caminho.
O mecanismo de tradução é ajustado para fala conversacional e informal — a maneira como os streamers realmente falam — não a saída rígida e formal que você obteria de um tradutor de documentos genérico.
Conversão Neural de Texto em Fala (TTS)
É aqui que a mágica acontece. StreamFluent não apenas exibe texto traduzido. Ele fala. Nosso mecanismo TTS gera uma voz com som natural no idioma de destino, sintetizada em tempo real.
Em nosso plano Pro, você pode criar um modelo de voz personalizado a partir de apenas uma amostra de áudio de 30 segundos. O sistema aprende as características de sua voz — tom, cadência, energia — e as aplica à saída traduzida. Sua transmissão em espanhol soa como você falando espanhol, não um robô genérico.
Em nosso plano Business, estamos lançando a replicação de voz completa com preservação de emoção — a voz dublada transmitirá sua excitação, frustração e humor entre os idiomas. (Este recurso estará disponível em breve, e os primeiros testadores o chamaram de "assustador".)
Passagem de Vídeo
Uma decisão de design crítica: nunca re-codificamos seu vídeo. Sua transmissão 1080p60 ou 4K passa por nossos servidores de retransmissão bit a bit. Apenas tocamos na faixa de áudio (e, opcionalmente, embutimos sobreposições de legendas). Isso significa zero perda de qualidade, latência adicional mínima e nenhum custo extra de GPU em sua extremidade.
Como Funciona: Configuração em Menos de 2 Minutos
Nós nos preocupamos em tornar o StreamFluent ridiculamente fácil de configurar. Não há plugins para instalar, nenhum cabo de áudio virtual para configurar, nenhuma fonte de navegador para lutar. Aqui está o fluxo completo:
Passo 1: Crie Sua Conta
Inscreva-se em streamfluent.ai com seu e-mail ou conecte-se diretamente com sua conta Twitch, YouTube ou Google. O nível gratuito está disponível imediatamente — nenhum cartão de crédito é necessário.
Passo 2: Configure Sua Voz
Para usuários Pro e Business, grave uma amostra de voz de 30 segundos diretamente no painel. Nosso sistema usa isso para construir seu perfil de voz personalizado. Você pode ajustar a taxa de fala (0,5x a 2,0x) e o tom (-12 a +12 semitons) para ajustar como sua voz dublada soa.
Usuários de nível gratuito têm acesso às nossas vozes TTS padrão de alta qualidade — ainda com som natural, apenas não personalizadas para sua voz específica.
Passo 3: Adicione Seus Destinos
É aqui que você configura onde cada idioma vai. Para cada idioma de destino, você especifica:
- O idioma (por exemplo, espanhol, japonês)
- A plataforma (Twitch, YouTube, Kick ou qualquer URL RTMP personalizado)
- A chave de transmissão para esse canal
- O modo de dublagem: dublagem completa de IA, apenas legendas ou ambos
Você pode executar quantos destinos seu plano permitir — um no nível gratuito, até três no Pro e ilimitado no Business.
Passo 4: Conecte o OBS e Entre Ao Vivo
Aqui está a parte que surpreende a todos: você apenas muda seu URL de transmissão no OBS. É isso.
Vá para OBS Studio → Configurações → Transmissão → selecione "Personalizado..." → cole seu URL RTMP StreamFluent e chave de transmissão. Estes são gerados automaticamente em seu painel.
Servidor: rtmp://ingest.streamfluent.ai/live
Chave de Transmissão: (sua chave exclusiva do painel)
Clique em "Iniciar Transmissão" no OBS. StreamFluent assume a partir daí. Sua transmissão original vai para seu canal principal (se você configurou um destino de passagem) e cada versão traduzida vai para seu respectivo canal de plataforma.
Sem plugins. Sem drivers de áudio virtual. Sem fontes de navegador. Se seu codificador pode gerar RTMP — e praticamente todos podem — ele funciona com StreamFluent.
Legendas e Dublagem: Controle Total, Por Destino
Um dos recursos mais solicitados durante nosso beta foi o controle granular sobre legendas e dublagem por destino. Públicos diferentes têm preferências diferentes, e queríamos dar aos streamers total flexibilidade.
Veja como funciona:
Modos de Dublagem
Cada destino pode ser definido para um dos três modos:
- Dublagem Automática: Se o idioma de destino for diferente do seu idioma de origem, a dublagem de voz completa de IA é aplicada. Esta é a configuração padrão e a mais comum.
- Apenas Legendas: Sua voz original é preservada, mas as legendas traduzidas são embutidas no vídeo. Ótimo para públicos que preferem ouvir a voz original, mas precisam de assistência de tradução.
- Apenas Original: A transmissão passa sem dublagem e sem legendas. Útil para seu destino de idioma "nativo".
Legendas Embutidas
O sistema de legendas do StreamFluent renderiza texto traduzido diretamente no feed de vídeo — nenhuma extensão ou configuração do lado do espectador é necessária. Todos que assistem veem as legendas, independentemente de seu dispositivo ou plataforma.
Você pode personalizar:
- Posição: Centro inferior ou centro superior
- Tamanho da fonte: 16px a 48px (padrão 24px)
- Idioma: As legendas correspondem ao idioma de destino
As legendas funcionam independentemente da dublagem. Você pode executar apenas legendas em alguns destinos e dublagem completa em outros. Você pode até executar ambos — áudio dublado com legendas correspondentes — para máxima acessibilidade.
Mixagem de Áudio
Quando a dublagem está ativa, o StreamFluent lida automaticamente com a mixagem de áudio:
- Volume de áudio original: Padrões para 20% (sua voz original se torna um fundo sutil, preservando os sons naturais da transmissão)
- Volume de áudio dublado: Padrões para 100%
- Auto-ducking: Quando a voz dublada está falando, o áudio original é automaticamente abaixado. Quando há silêncio (apenas áudio de jogabilidade, sem fala), o áudio original volta a subir.
Todos estes são ajustáveis por transmissão a partir do painel.
Construído para Confiabilidade: O Que Acontece Quando As Coisas Dão Errado
O streaming ao vivo é implacável. Se algo quebra, não há "desfazer". Construímos o StreamFluent com essa realidade no centro de cada decisão arquitetônica.
Modos de Latência
Casos de uso diferentes exigem diferentes compensações de latência-qualidade. StreamFluent oferece três modos:
- Latência Ultrabaixa (< 500ms): Para jogos competitivos e interação em ritmo acelerado. Disponível no plano Business.
- Equilibrado (< 1 segundo): O padrão recomendado para a maioria dos streamers. Disponível no Pro e Business.
- Qualidade (< 2 segundos): Prioriza a precisão da tradução em vez da velocidade. Melhor para conteúdo com muita conversa.
Comportamento de Fallback
Se o pipeline de IA encontrar um problema no meio da transmissão — uma breve falha de rede, um atraso momentâneo de processamento — o StreamFluent não apenas trava ou fica em silêncio. Você configura o que acontece:
- Passar Através (padrão): O áudio original, não traduzido, é emitido até que o pipeline se recupere. Seu público ouve você em seu idioma nativo por um momento, então a dublagem é retomada perfeitamente.
- Mudo: A faixa de áudio dublada fica em silêncio brevemente. Útil se você preferir ter silêncio do que áudio não traduzido.
- Mostrar Sobreposição: Uma breve mensagem na tela indica que a tradução está temporariamente indisponível.
Painel de Monitoramento Ao Vivo
Enquanto você está ao vivo, o painel do StreamFluent oferece um centro de comando em tempo real:
- Status por destino: Veja se cada saída de idioma está saudável, juntamente com contagens de espectadores e latência
- Níveis de áudio: Medidores visuais para cada fluxo de saída
- Feed de transcrição ao vivo: Assista à transcrição em tempo real em todos os idiomas, com guias para alternar entre eles
- Visualização TTS: Ouça o áudio dublado diretamente em seu navegador para verificar a qualidade
- Controles no meio da transmissão: Ative ou desative destinos individuais sem interromper sua transmissão
A Visão: Um Mundo Onde Todo Streamer Tem um Público Global
Começamos o StreamFluent porque acreditamos que o idioma não deve determinar o teto de um criador.
A internet deveria ser sem fronteiras. E de muitas maneiras, é — você pode assistir a uma transmissão de qualquer lugar do mundo, instantaneamente. Mas "assistir" e "entender" são duas coisas muito diferentes. Um espectador em Seul pode tecnicamente ser capaz de carregar um canal brasileiro do Twitch, mas se não conseguir entender uma palavra do que está sendo dito, ele sairá em segundos.
Isso cria uma segregação invisível. O mundo do streaming é fraturado em silos de idiomas, e os criadores estão presos dentro deles. Um artista brilhante na Cidade do México nunca alcançará organicamente o mercado japonês. Um streamer de variedades coreano com 100.000 seguidores leais não tem caminho para o público de língua inglesa que é 10 vezes maior.
StreamFluent é a ponte.
Prevemos um futuro onde:
- Um streamer em Buenos Aires entra ao vivo e entretém simultaneamente públicos em Tóquio, Berlim, Mumbai e Los Angeles — todos ouvindo a transmissão em seu próprio idioma, em uma voz que soa como a do criador.
- O idioma não é mais uma variável no algoritmo de descoberta. A qualidade do conteúdo é tudo o que importa.
- A classe média de criadores se expande globalmente, porque o talento é distribuído uniformemente entre os idiomas, mas a oportunidade não precisa mais ser.
- Comunidades multilíngues se formam em torno de criadores, com tradução de bate-papo e interação entre idiomas como um recurso nativo (sim, estamos trabalhando nisso também).
Esta é uma grande visão. Ainda não chegamos lá. Mas com o lançamento de hoje, a base está no lugar.
Preços: Comece Grátis, Escale Conforme Você Cresce
Projetamos os preços do StreamFluent para serem acessíveis a criadores em todos os níveis.
Plano Gratuito — $0/mês
- 30 minutos de legenda e 15 minutos dublados por mês
- 1 idioma de destino
- Vozes TTS padrão
- Acesso total ao painel de monitoramento ao vivo
- Nenhum cartão de crédito é necessário
Uma transmissão típica de 1 hora usa aproximadamente 30 minutos de tempo de legenda e 35 minutos de tempo dublado (medimos o tempo real de processamento de fala, não o tempo de relógio de parede — então pausas, segmentos apenas de jogabilidade e silêncio não contam). O plano Gratuito oferece o suficiente para testar uma transmissão completa e experimentar a qualidade em primeira mão.
Plano Pro — $29/mês
- 600 minutos de legenda e 300 minutos dublados por mês (~20 horas de streaming)
- Até 3 idiomas de destino
- Modelo de voz personalizado de uma amostra de 30 segundos
- Distribuição de retransmissão RTMP para várias plataformas
- Controles de mixagem de áudio
- Limite de gastos configurável para excedente
- Teste gratuito de 14 dias
Plano Business — $79/mês
- Minutos de legenda ilimitados e 1.200 minutos dublados por mês (~80 horas de streaming)
- Idiomas de destino ilimitados
- Modo de latência ultrabaixa (< 500ms)
- Ajuste de voz avançado
- Replicação de voz com preservação de emoção (em breve)
- Suporte prioritário
Enterprise — Preços Personalizados
- Ilimitado em tudo
- Infraestrutura de retransmissão dedicada
- Integração de API personalizada
- Garantias de SLA
- Opções de marca branca
Todos os planos pagos usam medição de precisão — contamos apenas os segundos em que nossa IA está realmente fazendo o trabalho. Se você estiver jogando silenciosamente por 10 minutos, são 0 minutos de legenda e 0 minutos dublados. Você paga pelo que usa e nada mais.
Os planos pagos também incluem um limite de gastos configurável para que você nunca seja surpreendido por cobranças de excedente. Defina-o como $0 para parar completamente em seus minutos incluídos ou remova a tampa completamente para streaming ininterrupto.
Experimente Hoje
StreamFluent está ao vivo. O nível gratuito está disponível agora em streamfluent.ai. Sem cartão de crédito. Sem compromisso. Basta se inscrever, colar um URL RTMP no OBS e transmitir para o mundo.
Se você é um criador que já se perguntou como seria seu público sem uma barreira de idioma — esta é sua resposta.
Se você é um espectador que já clicou para sair de uma transmissão incrível porque não conseguia entender o idioma — esses dias estão contados.
Construímos o StreamFluent porque acreditamos que o melhor conteúdo deve vencer, independentemente do idioma em que esteja. E a partir de hoje, pode.
Sua voz. Todos os idiomas. Vamos lá.
StreamFluent suporta Twitch, YouTube, Kick e qualquer plataforma compatível com RTMP. Atualmente disponível em 15 idiomas com mais sendo adicionados regularmente. Perguntas? Entre em contato conosco em support@streamfluent.ai ou verifique nossa documentação.