LocalVocal OBS翻訳プラグイン レビュー:無料のローカルキャプション 対 クラウド代替案 (Reddit 2026)
Matt McElligott
RedditでライブストリームにOBS翻訳を追加する方法を尋ねると、LocalVocalがほとんどすべての返信に登場します。128,000以上のダウンロード数、4.27つ星の評価、そしてv0.5.3(2025年11月)までの活発な開発により、オーディオをクラウドに送信することなく無料、ローカル、リアルタイムのキャプションと翻訳を求めるストリーマーにとって、これがデフォルトの推奨となっています。
しかし、Redditで「最高のOBS翻訳プラグイン」という言葉は、人によって意味が異なります。プライバシーを重視する人もいれば、CPUへの影響をゼロにしたい人もいます。Twitchストリームをブラジルに届けたい人もいますが、それには画面上の翻訳テキスト以上のものが必要です。
このレビューでは、LocalVocalが実際に何をするのか、OBSフォーラムやRedditのレビュー担当者が何を報告しているのか、そしてStreamTranslateやStreamFluentのようなクラウド代替サービスがより理にかなっているのはどのような場合かを解説します。
LocalVocalとは?
LocalVocalは、royshilkrotによるOBS Studioプラグインで、あらゆる音声ソース(マイク、メディア入力)にオーディオフィルターを追加します。OpenAIのWhisperモデルを使用して音声をリアルタイムでテキストに書き起こし、whisper.cppを介してローカルで実行されます。翻訳については、以下をサポートしています。
- Whisper内蔵翻訳(音声 → 英語テキスト)
- CTranslate2とM2M100モデルによるニューラル機械翻訳
すべてがあなたのマシン上で実行されます。APIキーは不要。サブスクリプションも不要。音声がPCから出ることはありません。
要件: OBS Studio 30.2.0以降、Windows/macOS/Linux、64ビット。
ダウンロード: GitHubリリースまたはOBSフォーラムのリソースページ。
LocalVocalの機能
リアルタイム書き起こし(100言語)
LocalVocalはWhisperを使ってライブ音声をテキストに書き起こします。OBSのテキストソースを介して画面にキャプションを表示したり、.txtまたは.srtファイルにエクスポートしたり、RTMP経由でYouTubeのようなプラットフォームにキャプションを送信したりできます。
リアルタイム翻訳
Whisperの内蔵翻訳または専用のNMTモデルを使用して、キャプションを主要言語に翻訳します。これはテキスト翻訳であり、翻訳された単語は音声としてではなく、キャプションとして表示されます。
独自のWhisperモデルを持ち込む
上級ユーザーは、Hugging FaceからGGML互換のWhisperモデルをロードでき、速度と精度のトレードオフを調整できます。
ハードウェアアクセラレーション
LocalVocalはCUDA(NVIDIA)、OpenCL(AMD)、Apple Silicon(Arm64)、AVX、SSEをサポートしています。OBSのリストには「GPU不要」とありますが、Redditのレビュー担当者は、CPUのみのモードは使用可能であるものの、ゲームと並行してライブストリーミングを行うにはあまり良くないと一貫して報告しています。
プライバシー優先のアーキテクチャ
マイク音声をサードパーティサーバーに送信することを拒否するストリーマーにとって、LocalVocalはOBS翻訳プラグインカテゴリで最も明確な答えです。すべての推論はローカルで行われます。
その他の出力オプション
- OBS録画タイムスタンプと同期したキャプション
- RTMPキャプションストリームの注入
- ポストプロダクション字幕用のファイルエクスポート
LocalVocalセットアップの概要
- GitHubリリースからOS用のプラグインをダウンロードします
- OBSプラグインフォルダにインストールします
- マイクソースにLocalVocalをオーディオフィルターとして追加します
- プラグイン設定内からWhisperモデルをダウンロードします
- 画面上のキャプション用に、出力をOBSのテキストソースに接続します
- 必要に応じて翻訳ターゲット言語を設定します
セットアップには15〜30分かかりますが、ほとんどはモデルのダウンロード(モデルサイズに応じて通常100MB〜3GB)を待つ時間です。
RedditとOBSフォーラムのレビュー担当者の意見
LocalVocalのOBSフォーラムでの評価は、11件のレビューで4.27/5と高く、完璧ではありませんが強力です。公開レビューからの繰り返しのテーマは次のとおりです。
良い点:
- 基本的なキャプションの「セットアップは約5分で完了した」(FiniteSingularity、5つ星)
- 「説明通りの機能」(Grumpus、5つ星)
- 「完全にローカルで実装された音声認識はすでに非常にうまく機能している」(wombat94、5つ星)
- ドイツ人ストリーマーは、翻訳されたキャプションで英語圏の視聴者を維持できることを高く評価している(EinfachSmon、4つ星)
悪い点:
- 一部のユーザーでモデルのダウンロードが0%で止まる(eserll、2つ星)
- AMD/NVIDIAアクセラレーションがない場合、CPUのみのパフォーマンスは「いまいち」(Tallicia、5つ星だが指摘あり)
- 時折キャプションの繰り返し/バッファがクリアされない(Tallicia)
- ドキュメントの不足 — 「適切なモデルを見つけるのが非常に難しい」(EinfachSmon、4つ星)
これらのRedditに近いレビュー(OBSフォーラムは、プラグインがRedditに登場する前にストリーミングコミュニティが議論する場所です)は、LocalVocalがまともなハードウェアを持つキャプション重視のストリーマーにとっては信頼できるが、すべての人にとってプラグアンドプレイではないことを示唆しています。
LocalVocal vs StreamTranslate: ローカルプラグイン vs クラウドブラウザソース
RedditでのOBS翻訳に関する議論は、しばしばLocalVocalとStreamTranslateのようなクラウドブラウザソースとの比較になります。
| LocalVocal | StreamTranslate | |
|---|---|---|
| 費用 | 無料 | $14.99–$149/月 |
| インストール | プラグイン + モデルダウンロード | ブラウザソースURL |
| 処理 | ローカル (CPU/GPU) | クラウド |
| ストリームへのGPU影響 | あり — Whisperはローカルで実行 | ゼロ |
| プライバシー | 完全ローカル | 音声はクラウドに送信 |
| 言語 | 100 (書き起こし) | 30+ (翻訳) |
| Twitch拡張機能 | ❌ | ✅ (視聴者ごとの言語) |
| オフライン | ✅ | ❌ |
| OBSアップデートで壊れるか? | 時々(プラグイン互換性) | いいえ(ブラウザソース) |
StreamTranslateのOBSフォーラムリストは、この比較を明確にターゲットにしています。ブラウザソースは「OBSのアップデートで壊れることはなく」、「パフォーマンスへの影響はゼロ」です。
Redditの経験則: GPUの余裕があり、プライバシーを重視するならLocalVocal。2分でセットアップでき、ローカルでの計算をゼロにしたいならStreamTranslate。
LocalVocal vs StreamFluent: キャプション vs AI音声吹き替え
Redditがめったに行わない比較(ほとんどのスレッドがキャプションで止まるため)は、LocalVocalと音声吹き替え付きのストリーム翻訳サービスとの比較です。
| LocalVocal | StreamFluent | |
|---|---|---|
| 出力 | テキストキャプション | 吹き替え音声 + キャプション |
| OBS統合 | オーディオフィルタープラグイン | OBSプラグイン + RTMPリレー |
| 視聴者体験 | 字幕を読む | 翻訳された音声を聞く |
| マルチプラットフォーム言語ストリーム | ❌ | ✅ |
| 音声クローン | ❌ | ✅ |
| 費用 | 無料 | 無料ティア + 有料プラン |
| 処理 | ローカル | クラウド |
StreamFluentは別の問題を解決します。LocalVocalは「ストリームに翻訳されたテキストを表示するにはどうすればよいですか?」と問いに答えます。StreamFluentは「字幕を読まない視聴者にリーチするにはどうすればよいですか?」と問いに答えます。
英語のTwitchに進出しようとしている日本人ストリーマーにとって、キャプションは役立ちます。英語の吹き替えは、英語圏の視聴者がクリックして視聴するか、スクロールして通り過ぎるかを左右します。そのため、国際的な視聴者数を増やすことに関するRedditのスレッドでは、OBS翻訳プラグインの推奨だけでなく、吹き替えツールがますます言及されるようになっています。
LocalVocalが最適な選択肢となる場合
LocalVocalを選ぶべき場合:
- ✅ 月額料金なしで無料のOBS翻訳をしたい場合
- ✅ プライバシーが譲れない場合 — クラウドでの音声処理はなし
- ✅ キャプションとテキスト翻訳がアクセシビリティの目標を満たす場合
- ✅ スムーズなリアルタイム推論のためにGPU(NVIDIA CUDAまたはApple Silicon)を持っている場合
- ✅ YouTube VOD字幕用に
.srtファイルをエクスポートする場合
LocalVocalをスキップすべき場合
代替案を検討すべき場合:
- ❌ PCがすでにゲーム+ストリーミングで苦戦している場合(Whisperが負荷を追加します)
- ❌ 翻訳されたテキストだけでなく、翻訳された音声が必要な場合
- ❌ Twitch、YouTube、Kickに同時に別々の言語出力をしたい場合
- ❌ モデルのダウンロードに失敗したり、GGMLモデル用のディスク容量が不足している場合
- ❌ ローカルAIを実行せずに無制限のキャプションが必要な場合(StreamFluent無料ティア)
LocalVocalロードマップ(今後の予定)
OBSフォーラムのリストによると、計画されている機能は次のとおりです。
- より堅牢な内蔵翻訳オプション
- 追加の字幕フォーマット(
.vtt、.ssa、.sub) - 話者ダイアライゼーション(複数の話者を検出)
ロードマップに特に記載されていないのは、音声吹き替えや複数宛先言語オーディオです。LocalVocalはキャプションレイヤーに特化しており、これはローカルプラグインとしては適切な範囲ですが、成長志向のストリーマーにとってはその有用性を制限します。
2026年の最高のOBS翻訳スタック
RedditのOBS翻訳に関するアドバイスは