ブログに戻る

LocalVocal OBS翻訳プラグイン レビュー:無料のローカルキャプション 対 クラウド代替案 (Reddit 2026)

Matt McElligott

Matt McElligott

2026年7月4日2 分で読めます0 回表示

RedditでライブストリームにOBS翻訳を追加する方法を尋ねると、LocalVocalがほとんどすべての返信に登場します。128,000以上のダウンロード数、4.27つ星の評価、そしてv0.5.3(2025年11月)までの活発な開発により、オーディオをクラウドに送信することなく無料、ローカル、リアルタイムのキャプションと翻訳を求めるストリーマーにとって、これがデフォルトの推奨となっています。

しかし、Redditで「最高のOBS翻訳プラグイン」という言葉は、人によって意味が異なります。プライバシーを重視する人もいれば、CPUへの影響をゼロにしたい人もいます。Twitchストリームをブラジルに届けたい人もいますが、それには画面上の翻訳テキスト以上のものが必要です。

このレビューでは、LocalVocalが実際に何をするのか、OBSフォーラムやRedditのレビュー担当者が何を報告しているのか、そしてStreamTranslateStreamFluentのようなクラウド代替サービスがより理にかなっているのはどのような場合かを解説します。


LocalVocalとは?

LocalVocalは、royshilkrotによるOBS Studioプラグインで、あらゆる音声ソース(マイク、メディア入力)にオーディオフィルターを追加します。OpenAIのWhisperモデルを使用して音声をリアルタイムでテキストに書き起こし、whisper.cppを介してローカルで実行されます。翻訳については、以下をサポートしています。

  • Whisper内蔵翻訳(音声 → 英語テキスト)
  • CTranslate2とM2M100モデルによるニューラル機械翻訳

すべてがあなたのマシン上で実行されます。APIキーは不要。サブスクリプションも不要。音声がPCから出ることはありません。

要件: OBS Studio 30.2.0以降、Windows/macOS/Linux、64ビット。

ダウンロード: GitHubリリースまたはOBSフォーラムのリソースページ


LocalVocalの機能

リアルタイム書き起こし(100言語)

LocalVocalはWhisperを使ってライブ音声をテキストに書き起こします。OBSのテキストソースを介して画面にキャプションを表示したり、.txtまたは.srtファイルにエクスポートしたり、RTMP経由でYouTubeのようなプラットフォームにキャプションを送信したりできます。

リアルタイム翻訳

Whisperの内蔵翻訳または専用のNMTモデルを使用して、キャプションを主要言語に翻訳します。これはテキスト翻訳であり、翻訳された単語は音声としてではなく、キャプションとして表示されます。

独自のWhisperモデルを持ち込む

上級ユーザーは、Hugging FaceからGGML互換のWhisperモデルをロードでき、速度と精度のトレードオフを調整できます。

ハードウェアアクセラレーション

LocalVocalはCUDA(NVIDIA)、OpenCL(AMD)、Apple Silicon(Arm64)、AVX、SSEをサポートしています。OBSのリストには「GPU不要」とありますが、Redditのレビュー担当者は、CPUのみのモードは使用可能であるものの、ゲームと並行してライブストリーミングを行うにはあまり良くないと一貫して報告しています。

プライバシー優先のアーキテクチャ

マイク音声をサードパーティサーバーに送信することを拒否するストリーマーにとって、LocalVocalはOBS翻訳プラグインカテゴリで最も明確な答えです。すべての推論はローカルで行われます。

その他の出力オプション

  • OBS録画タイムスタンプと同期したキャプション
  • RTMPキャプションストリームの注入
  • ポストプロダクション字幕用のファイルエクスポート

LocalVocalセットアップの概要

  1. GitHubリリースからOS用のプラグインをダウンロードします
  2. OBSプラグインフォルダにインストールします
  3. マイクソースにLocalVocalをオーディオフィルターとして追加します
  4. プラグイン設定内からWhisperモデルをダウンロードします
  5. 画面上のキャプション用に、出力をOBSのテキストソースに接続します
  6. 必要に応じて翻訳ターゲット言語を設定します

セットアップには15〜30分かかりますが、ほとんどはモデルのダウンロード(モデルサイズに応じて通常100MB〜3GB)を待つ時間です。


RedditとOBSフォーラムのレビュー担当者の意見

LocalVocalのOBSフォーラムでの評価は、11件のレビューで4.27/5と高く、完璧ではありませんが強力です。公開レビューからの繰り返しのテーマは次のとおりです。

良い点:

  • 基本的なキャプションの「セットアップは約5分で完了した」(FiniteSingularity、5つ星)
  • 「説明通りの機能」(Grumpus、5つ星)
  • 「完全にローカルで実装された音声認識はすでに非常にうまく機能している」(wombat94、5つ星)
  • ドイツ人ストリーマーは、翻訳されたキャプションで英語圏の視聴者を維持できることを高く評価している(EinfachSmon、4つ星)

悪い点:

  • 一部のユーザーでモデルのダウンロードが0%で止まる(eserll、2つ星)
  • AMD/NVIDIAアクセラレーションがない場合、CPUのみのパフォーマンスは「いまいち」(Tallicia、5つ星だが指摘あり)
  • 時折キャプションの繰り返し/バッファがクリアされない(Tallicia)
  • ドキュメントの不足 — 「適切なモデルを見つけるのが非常に難しい」(EinfachSmon、4つ星)

これらのRedditに近いレビュー(OBSフォーラムは、プラグインがRedditに登場する前にストリーミングコミュニティが議論する場所です)は、LocalVocalがまともなハードウェアを持つキャプション重視のストリーマーにとっては信頼できるが、すべての人にとってプラグアンドプレイではないことを示唆しています。


LocalVocal vs StreamTranslate: ローカルプラグイン vs クラウドブラウザソース

RedditでのOBS翻訳に関する議論は、しばしばLocalVocalとStreamTranslateのようなクラウドブラウザソースとの比較になります。

LocalVocalStreamTranslate
費用無料$14.99–$149/月
インストールプラグイン + モデルダウンロードブラウザソースURL
処理ローカル (CPU/GPU)クラウド
ストリームへのGPU影響あり — Whisperはローカルで実行ゼロ
プライバシー完全ローカル音声はクラウドに送信
言語100 (書き起こし)30+ (翻訳)
Twitch拡張機能✅ (視聴者ごとの言語)
オフライン
OBSアップデートで壊れるか?時々(プラグイン互換性)いいえ(ブラウザソース)

StreamTranslateのOBSフォーラムリストは、この比較を明確にターゲットにしています。ブラウザソースは「OBSのアップデートで壊れることはなく」、「パフォーマンスへの影響はゼロ」です。

Redditの経験則: GPUの余裕があり、プライバシーを重視するならLocalVocal。2分でセットアップでき、ローカルでの計算をゼロにしたいならStreamTranslate。


LocalVocal vs StreamFluent: キャプション vs AI音声吹き替え

Redditがめったに行わない比較(ほとんどのスレッドがキャプションで止まるため)は、LocalVocalと音声吹き替え付きのストリーム翻訳サービスとの比較です。

LocalVocalStreamFluent
出力テキストキャプション吹き替え音声 + キャプション
OBS統合オーディオフィルタープラグインOBSプラグイン + RTMPリレー
視聴者体験字幕を読む翻訳された音声を聞く
マルチプラットフォーム言語ストリーム
音声クローン
費用無料無料ティア + 有料プラン
処理ローカルクラウド

StreamFluentは別の問題を解決します。LocalVocalは「ストリームに翻訳されたテキストを表示するにはどうすればよいですか?」と問いに答えます。StreamFluentは「字幕を読まない視聴者にリーチするにはどうすればよいですか?」と問いに答えます。

英語のTwitchに進出しようとしている日本人ストリーマーにとって、キャプションは役立ちます。英語の吹き替えは、英語圏の視聴者がクリックして視聴するか、スクロールして通り過ぎるかを左右します。そのため、国際的な視聴者数を増やすことに関するRedditのスレッドでは、OBS翻訳プラグインの推奨だけでなく、吹き替えツールがますます言及されるようになっています。


LocalVocalが最適な選択肢となる場合

LocalVocalを選ぶべき場合:

  • ✅ 月額料金なしで無料のOBS翻訳をしたい場合
  • プライバシーが譲れない場合 — クラウドでの音声処理はなし
  • キャプションとテキスト翻訳がアクセシビリティの目標を満たす場合
  • ✅ スムーズなリアルタイム推論のためにGPU(NVIDIA CUDAまたはApple Silicon)を持っている場合
  • ✅ YouTube VOD字幕用に.srtファイルをエクスポートする場合

LocalVocalをスキップすべき場合

代替案を検討すべき場合:

  • ❌ PCがすでにゲーム+ストリーミングで苦戦している場合(Whisperが負荷を追加します)
  • ❌ 翻訳されたテキストだけでなく、翻訳された音声が必要な場合
  • ❌ Twitch、YouTube、Kickに同時に別々の言語出力をしたい場合
  • ❌ モデルのダウンロードに失敗したり、GGMLモデル用のディスク容量が不足している場合
  • ❌ ローカルAIを実行せずに無制限のキャプションが必要な場合(StreamFluent無料ティア

LocalVocalロードマップ(今後の予定)

OBSフォーラムのリストによると、計画されている機能は次のとおりです。

  • より堅牢な内蔵翻訳オプション
  • 追加の字幕フォーマット(.vtt.ssa.sub
  • 話者ダイアライゼーション(複数の話者を検出)

ロードマップに特に記載されていないのは、音声吹き替え複数宛先言語オーディオです。LocalVocalはキャプションレイヤーに特化しており、これはローカルプラグインとしては適切な範囲ですが、成長志向のストリーマーにとってはその有用性を制限します。


2026年の最高のOBS翻訳スタック

RedditのOBS翻訳に関するアドバイスは

Comments

Not displayed publicly