Retour au blog

StreamFluent : La première traduction vocale IA en temps réel au monde pour les streamers est disponible.

S

StreamFluent

16 février 202616 min de lecture0 vues
StreamFluent : La première traduction vocale IA en temps réel au monde pour les streamers est disponible.

En ce moment même, quelque part sur Twitch, un streamer à São Paulo réalise l'un des speedruns les plus impressionnants qu'Internet ait jamais vus. Ses commentaires sont électrisants. Son chat explose. Il a 8 000 spectateurs simultanés et chacun d'eux parle portugais.

À l'autre bout de la planète, un public anglophone de millions de personnes ne saura jamais que ce streamer existe. Non pas parce que le contenu n'est pas assez bon. Non pas parce que le gameplay n'est pas au rendez-vous. Mais à cause d'un seul mur invisible qui a défini les frontières du divertissement en ligne depuis la première webcam : la langue.

Aujourd'hui, nous abattons ce mur.

StreamFluent est la première plateforme de doublage vocal et de sous-titrage en temps réel basée sur l'IA, conçue spécifiquement pour les streamers en direct. Vous streamez une seule fois, dans votre langue maternelle. StreamFluent écoute, transcrit, traduit et redonne une voix à votre stream — dans plus de 15 langues — chacune étant diffusée sur sa propre chaîne sur Twitch, YouTube, Kick ou toute plateforme compatible RTMP.

Il ne s'agit pas d'un doublage en post-production. Il ne s'agit pas de sous-titres que vous ajoutez après la mise en ligne d'une VOD. Cela se passe en direct, avec une latence inférieure à une seconde, pendant que vous jouez, réagissez ou discutez avec votre public.

Laissez-nous vous expliquer comment nous en sommes arrivés là, ce que nous avons construit et pourquoi nous pensons que cela change tout pour les créateurs.


Le problème : la langue est la dernière barrière dans le streaming en direct

L'industrie du streaming a résolu presque tous les autres problèmes de distribution. Vous pouvez passer en direct depuis votre chambre et toucher des spectateurs sur tous les continents. Les plateformes disposent de CDN mondiaux qui diffusent la vidéo en quelques millisecondes. Les algorithmes de découverte présentent du contenu à de nouveaux publics 24 heures sur 24. Les systèmes de paiement permettent aux fans de Tokyo de donner un pourboire à un créateur à Toronto.

Mais la langue ? La langue est toujours un mur difficile à franchir.

Considérez les chiffres. Il y a environ 2,5 millions de streamers actifs rien que sur Twitch. La grande majorité d'entre eux streament dans une seule langue. L'anglais domine les plateformes occidentales, mais les communautés de streaming qui connaissent la croissance la plus rapide sont en espagnol, portugais, japonais, coréen et hindi. Ces publics sont massifs, engagés et largement isolés les uns des autres.

Un streamer hispanophone avec un gameplay incroyable et une personnalité magnétique atteint un plafond dès que son spectateur potentiel ne parle pas espagnol. La même chose est vraie en sens inverse — un créateur anglophone avec une communauté fidèle de 50 000 personnes n'a pratiquement aucune portée sur les 500 millions d'internautes japonophones.

Ce n'est pas un petit problème. C'est le plus grand levier de croissance inexploité dans toute l'économie des créateurs. Et jusqu'à présent, les solutions étaient soit inexistantes, soit risibles :

  • Traduction manuelle ? Vous auriez besoin d'un interprète humain en appel vocal, en direct, pour chaque stream, dans chaque langue. Le coût à lui seul est prohibitif. La latence rend le tout impossible à regarder.
  • Sous-titres post-stream ? Mieux que rien pour les VOD, mais ils ne font rien pour l'audience en direct — là où se trouvent l'argent, la communauté et l'élan.
  • Superpositions de sous-titres basées sur le navigateur ? Il existe une poignée d'outils, mais ils ne gèrent que les sous-titres textuels, nécessitent des configurations complexes de plugins OBS et ne résolvent pas le problème fondamental : votre voix est toujours dans une seule langue.

Le monde du streaming avait besoin de quelque chose de complètement nouveau. Un système capable de traiter la parole, de la traduire et de synthétiser une nouvelle voix — le tout en temps réel, le tout sans que le streamer ne modifie son flux de travail.

C'est ce que nous avons construit.


Ce que nous avons construit : doublage IA en temps réel pour les streams en direct

StreamFluent est un pipeline d'IA en temps réel qui se situe entre votre encodeur de streaming (OBS Studio, Streamlabs ou tout logiciel compatible RTMP) et vos plateformes de destination. Voici ce qui se passe lorsque vous passez en direct :

  1. Vous streamez normalement dans votre langue maternelle. Rien ne change dans votre configuration, sauf l'URL de destination RTMP dans OBS.
  2. StreamFluent ingère votre stream via nos serveurs de relais RTMP. Votre vidéo passe sans être touchée — nous ne réencodons jamais votre vidéo.
  3. Notre pipeline d'IA traite votre audio en temps réel : la reconnaissance vocale transcrit ce que vous dites, la traduction automatique le convertit dans vos langues cibles et la synthèse vocale neuronale synthétise une nouvelle piste vocale pour chaque langue.
  4. Chaque stream traduit est diffusé vers sa propre destination — une chaîne Twitch distincte, un stream YouTube ou une chaîne Kick — avec la piste audio doublée et des sous-titres incrustés en option.

Le résultat : vous streamez une seule fois. Votre public regarde dans quinze langues. Chaque version sonne naturellement, reste synchronisée et arrive avec une latence inférieure à une seconde.

Décomposons chaque élément.

Reconnaissance vocale (STT)

La première étape du pipeline est la reconnaissance vocale automatique. Le moteur STT de StreamFluent traite votre audio en temps réel, convertissant la parole en texte avec une grande précision, même dans des environnements de jeu bruyants. Nous avons optimisé spécifiquement pour le cas d'utilisation du streaming — commentaires rapides, audio de jeu en arrière-plan, sons qui se chevauchent et le chaos général d'une diffusion en direct.

Traduction automatique

Une fois que nous avons votre transcription, notre couche de traduction la convertit dans vos langues cibles configurées. Nous prenons actuellement en charge 15 langues : espagnol, japonais, portugais, français, allemand, coréen, chinois (mandarin), italien, russe, arabe, hindi, turc, néerlandais, polonais et thaï — et d'autres sont en préparation.

Le moteur de traduction est adapté à la parole conversationnelle et informelle — la façon dont les streamers parlent réellement — et non à la sortie rigide et formelle que vous obtiendriez d'un traducteur de documents générique.

Synthèse vocale neuronale (TTS)

C'est là que la magie opère. StreamFluent n'affiche pas seulement du texte traduit. Il le prononce. Notre moteur TTS génère une voix naturelle dans la langue cible, synthétisée en temps réel.

Sur notre plan Pro, vous pouvez créer un modèle de voix personnalisé à partir d'un simple échantillon audio de 30 secondes. Le système apprend les caractéristiques de votre voix — ton, cadence, énergie — et les applique à la sortie traduite. Votre stream espagnol vous ressemble vous parlant espagnol, pas un robot générique.

Sur notre plan Business, nous déployons la réplication vocale complète avec préservation des émotions — la voix doublée transmettra votre enthousiasme, votre frustration et votre humour à travers les langues. (Cette fonctionnalité arrive bientôt, et les premiers testeurs l'ont qualifiée d'"étrange".)

Passthrough vidéo

Une décision de conception essentielle : nous ne réencodons jamais votre vidéo. Votre stream 1080p60 ou 4K passe par nos serveurs de relais bit par bit. Nous ne touchons qu'à la piste audio (et éventuellement à l'incrustation de sous-titres). Cela signifie une perte de qualité nulle, une latence ajoutée minimale et aucun coût GPU supplémentaire de votre côté.


Comment ça marche : configuration en moins de 2 minutes

Nous avons tout fait pour que StreamFluent soit incroyablement facile à configurer. Il n'y a pas de plugins à installer, pas de câbles audio virtuels à configurer, pas de sources de navigateur avec lesquelles se battre. Voici le flux complet :

Étape 1 : Créez votre compte

Inscrivez-vous sur streamfluent.ai avec votre adresse e-mail ou connectez-vous directement avec votre compte Twitch, YouTube ou Google. Le niveau gratuit est disponible immédiatement — aucune carte de crédit n'est requise.

Étape 2 : Configurez votre voix

Pour les utilisateurs Pro et Business, enregistrez un échantillon de voix de 30 secondes directement dans le tableau de bord. Notre système l'utilise pour créer votre profil vocal personnalisé. Vous pouvez ajuster la vitesse d'élocution (0,5x à 2,0x) et la hauteur (-12 à +12 demi-tons) pour affiner le son de votre voix doublée.

Les utilisateurs du niveau gratuit ont accès à nos voix TTS standard de haute qualité — toujours naturelles, mais pas personnalisées à votre voix spécifique.

Étape 3 : Ajoutez vos destinations

C'est là que vous configurez va chaque langue. Pour chaque langue cible, vous spécifiez :

  • La langue (par exemple, espagnol, japonais)
  • La plateforme (Twitch, YouTube, Kick ou toute URL RTMP personnalisée)
  • La clé de stream pour cette chaîne
  • Le mode de doublage : doublage IA complet, sous-titres uniquement ou les deux

Vous pouvez exécuter autant de destinations que votre plan le permet — une sur le niveau gratuit, jusqu'à trois sur Pro et illimitées sur Business.

Étape 4 : Connectez OBS et passez en direct

Voici la partie qui surprend tout le monde : vous changez simplement votre URL de stream dans OBS. C'est tout.

Allez dans OBS Studio → Paramètres → Stream → sélectionnez "Personnalisé..." → collez votre URL RTMP StreamFluent et votre clé de stream. Elles sont générées automatiquement dans votre tableau de bord.

Serveur : rtmp://ingest.streamfluent.ai/live
Clé de stream : (votre clé unique du tableau de bord)

Cliquez sur "Démarrer le streaming" dans OBS. StreamFluent prend le relais à partir de là. Votre stream original va sur votre chaîne principale (si vous avez configuré une destination passthrough), et chaque version traduite va sur sa chaîne de plateforme respective.

Pas de plugins. Pas de pilotes audio virtuels. Pas de sources de navigateur. Si votre encodeur peut sortir du RTMP — et pratiquement tous le peuvent — il fonctionne avec StreamFluent.


Sous-titres et doublage : contrôle total, par destination

L'une des fonctionnalités les plus demandées pendant notre version bêta était le contrôle granulaire des sous-titres et du doublage par destination. Différents publics ont des préférences différentes, et nous voulions donner aux streamers une flexibilité totale.

Voici comment ça marche :

Modes de doublage

Chaque destination peut être définie sur l'un des trois modes suivants :

  • Doublage automatique : si la langue de destination diffère de votre langue source, le doublage vocal IA complet est appliqué. C'est le paramètre par défaut et le plus courant.
  • Sous-titres uniquement : votre voix originale est conservée, mais des sous-titres traduits sont incrustés dans la vidéo. Idéal pour les publics qui préfèrent entendre la voix originale mais ont besoin d'une assistance à la traduction.
  • Original uniquement : le stream passe sans doublage ni sous-titres. Utile pour votre destination de langue "d'origine".

Sous-titres incrustés

Le système de sous-titres de StreamFluent affiche le texte traduit directement dans le flux vidéo — aucune extension ou paramètre côté spectateur n'est requis. Tous ceux qui regardent voient les sous-titres, quel que soit leur appareil ou leur plateforme.

Vous pouvez personnaliser :

  • Position : centre en bas ou centre en haut
  • Taille de la police : 16px à 48px (24px par défaut)
  • Langue : les sous-titres correspondent à la langue de destination

Les sous-titres fonctionnent indépendamment du doublage. Vous pouvez exécuter des sous-titres uniquement sur certaines destinations et un doublage complet sur d'autres. Vous pouvez même exécuter les deux — audio doublé avec sous-titres correspondants — pour une accessibilité maximale.

Mixage audio

Lorsque le doublage est actif, StreamFluent gère automatiquement le mixage audio :

  • Volume audio original : par défaut à 20 % (votre voix originale devient un arrière-plan subtil, préservant les sons naturels du stream)
  • Volume audio doublé : par défaut à 100 %
  • Auto-ducking : lorsque la voix doublée parle, l'audio original est automatiquement abaissé. Lorsqu'il y a du silence (audio de gameplay uniquement, pas de parole), l'audio original remonte.

Tous ces éléments sont réglables par stream depuis le tableau de bord.


Conçu pour la fiabilité : que se passe-t-il lorsque les choses tournent mal

Le streaming en direct est impitoyable. Si quelque chose se casse, il n'y a pas de "annuler". Nous avons construit StreamFluent avec cette réalité au cœur de chaque décision architecturale.

Modes de latence

Différents cas d'utilisation exigent différents compromis entre latence et qualité. StreamFluent propose trois modes :

  • Latence ultra-faible (< 500 ms) : pour les jeux compétitifs et l'interaction rapide. Disponible sur le plan Business.
  • Équilibré (< 1 seconde) : le paramètre par défaut recommandé pour la plupart des streamers. Disponible sur Pro et Business.
  • Qualité (< 2 secondes) : donne la priorité à la précision de la traduction par rapport à la vitesse. Idéal pour le contenu riche en conversations.

Comportement de repli

Si le pipeline d'IA rencontre un problème en cours de stream — un bref hoquet de réseau, un retard de traitement momentané — StreamFluent ne se contente pas de planter ou de se taire. Vous configurez ce qui se passe :

  • Pass Through (par défaut) : l'audio original, non traduit, est diffusé jusqu'à ce que le pipeline se rétablisse. Votre public vous entend dans votre langue maternelle pendant un moment, puis le doublage reprend de manière transparente.
  • Muet : la piste audio doublée se tait brièvement. Utile si vous préférez le silence à l'audio non traduit.
  • Afficher la superposition : un bref message à l'écran indique que la traduction est temporairement indisponible.

Tableau de bord de surveillance en direct

Pendant que vous êtes en direct, le tableau de bord StreamFluent vous offre un centre de commande en temps réel :

  • État par destination : voyez si chaque sortie de langue est saine, ainsi que le nombre de spectateurs et la latence
  • Niveaux audio : compteurs visuels pour chaque flux de sortie
  • Flux de transcription en direct : regardez la transcription en temps réel dans chaque langue, avec des onglets pour basculer entre elles
  • Aperçu TTS : écoutez l'audio doublé directement dans votre navigateur pour vérifier la qualité
  • Commandes en cours de stream : activez ou désactivez des destinations individuelles sans arrêter votre stream

La vision : un monde où chaque streamer a un public mondial

Nous avons créé StreamFluent parce que nous pensons que la langue ne devrait pas déterminer le plafond d'un créateur.

Internet était censé être sans frontières. Et à bien des égards, il l'est — vous pouvez regarder un stream de n'importe où dans le monde, instantanément. Mais "regarder" et "comprendre" sont deux choses très différentes. Un spectateur à Séoul pourrait techniquement charger une chaîne Twitch brésilienne, mais s'il ne comprend pas un mot de ce qui est dit, il partira en quelques secondes.

Cela crée une ségrégation invisible. Le monde du streaming est fracturé en silos linguistiques, et les créateurs sont piégés à l'intérieur. Un brillant artiste à Mexico n'atteindra jamais organiquement le marché japonais. Un streamer de variétés coréen avec 100 000 followers fidèles n'a aucun moyen d'atteindre le public anglophone qui est 10 fois plus important.

StreamFluent est le pont.

Nous envisageons un avenir où :

  • Un streamer à Buenos Aires passe en direct et divertit simultanément des publics à Tokyo, Berlin, Mumbai et Los Angeles — tous entendant le stream dans leur propre langue, avec une voix qui ressemble à celle du créateur.
  • La langue n'est plus une variable dans l'algorithme de découverte. La qualité du contenu est tout ce qui compte.
  • La classe moyenne des créateurs se développe à l'échelle mondiale, car le talent est réparti uniformément entre les langues, mais les opportunités ne doivent plus l'être.
  • Des communautés multilingues se forment autour des créateurs, avec la traduction de chat et l'interaction interlinguistique comme fonctionnalité native (oui, nous y travaillons aussi).

C'est une grande vision. Nous n'y sommes pas encore. Mais avec le lancement d'aujourd'hui, les bases sont en place.


Tarification : commencez gratuitement, évoluez au fur et à mesure de votre croissance

Nous avons conçu la tarification de StreamFluent pour qu'elle soit accessible aux créateurs de tous les niveaux.

Plan gratuit — 0 $/mois

  • 30 minutes de sous-titres et 15 minutes de doublage par mois
  • 1 langue cible
  • Voix TTS standard
  • Accès complet au tableau de bord de surveillance en direct
  • Aucune carte de crédit requise

Un stream typique d'une heure utilise environ 30 minutes de temps de sous-titrage et 35 minutes de temps de doublage (nous mesurons le temps de traitement de la parole réel, pas le temps d'horloge — donc les pauses, les segments de gameplay uniquement et le silence ne comptent pas). Le plan gratuit vous donne suffisamment de temps pour tester un stream complet et découvrir la qualité de première main.

Plan Pro — 29 $/mois

  • 600 minutes de sous-titres et 300 minutes de doublage par mois (~20 heures de streaming)
  • Jusqu'à 3 langues cibles
  • Modèle de voix personnalisé à partir d'un échantillon de 30 secondes
  • Distribution de relais RTMP vers plusieurs plateformes
  • Commandes de mixage audio
  • Limite de dépenses configurable pour le dépassement
  • Essai gratuit de 14 jours

Plan Business — 79 $/mois

  • Minutes de sous-titres illimitées et 1 200 minutes de doublage par mois (~80 heures de streaming)
  • Langues cibles illimitées
  • Mode de latence ultra-faible (< 500 ms)
  • Réglage vocal avancé
  • Réplication vocale avec préservation des émotions (à venir bientôt)
  • Assistance prioritaire

Entreprise — Tarification personnalisée

  • Tout illimité
  • Infrastructure de relais dédiée
  • Intégration API personnalisée
  • Garanties SLA
  • Options en marque blanche

Tous les plans payants utilisent un comptage de précision — nous ne comptons que les secondes où notre IA travaille réellement. Si vous jouez en silence pendant 10 minutes, cela fait 0 minute de sous-titres et 0 minute de doublage. Vous payez pour ce que vous utilisez, et rien de plus.

Les plans payants incluent également une limite de dépenses configurable afin que vous ne soyez jamais surpris par les frais de dépassement. Définissez-la sur 0 $ pour arrêter complètement à vos minutes incluses, ou supprimez complètement le plafond pour un streaming ininterrompu.


Essayez-le dès aujourd'hui

StreamFluent est en ligne. Le niveau gratuit est disponible dès maintenant sur streamfluent.ai. Pas de carte de crédit. Pas d'engagement. Inscrivez-vous simplement, collez une URL RTMP dans OBS et streamez dans le monde entier.

Si vous êtes un créateur qui s'est déjà demandé à quoi pourrait ressembler votre public sans barrière linguistique — voici votre réponse.

Si vous êtes un spectateur qui a déjà cliqué sur un stream incroyable parce que vous ne compreniez pas la langue — ces jours sont comptés.

Nous avons créé StreamFluent parce que nous pensons que le meilleur contenu devrait gagner, quelle que soit la langue dans laquelle il est. Et à partir d'aujourd'hui, c'est possible.

Votre voix. Toutes les langues. Allons-y.

Commencer le doublage gratuit →


StreamFluent prend en charge Twitch, YouTube, Kick et toute plateforme compatible RTMP. Actuellement disponible en 15 langues et d'autres sont ajoutées régulièrement. Des questions ? Contactez-nous à support@streamfluent.ai ou consultez notre documentation.

Comments

Not displayed publicly