meeting-translator 取扱説明書

英語会議のリアルタイム翻訳&質問サジェスト・オーバーレイ

meeting-translator は、Zoom / Teams / Google Meet などの英語会議の音声をリアルタイムに 文字起こし・日本語訳し、画面の最前面に字幕として重ねて表示するデスクトップアプリ(Windows 向け)です。 さらに 「いま聞くべき質問・確認事項」会話のハイライト を AI が自動生成し、 英語が苦手でも会議に主体的に参加できるよう支援します。

1. できること

2. 動作環境・技術構成

項目内容
対応OSWindows(システム音声キャプチャに対応)。開発・動作確認は macOS でもマイク入力で可能。
アプリ形態Electron 製デスクトップアプリ(枠なし・半透明・常に最前面)
音声認識(STT)Deepgram(Nova-3 モデル、ストリーミング)
翻訳・提案・要約Anthropic Claude(Haiku / Sonnet / Opus を選択可)
必要なものDeepgram APIキー + Anthropic APIキー(いずれも従量課金)

ElectronTypeScript Deepgram Nova-3Claude API Web Audio API

3. APIキーの取得

本アプリの利用には、音声認識用と翻訳用の2つのAPIキーが必要です。先に取得しておきましょう。

Deepgram APIキー(音声認識)

  1. console.deepgram.com にアクセスしてサインアップ/ログインします。
  2. プロジェクトを選択(または新規作成)します。
  3. 「API Keys」から新しいキーを作成します。
  4. 表示されたキーをコピーしておきます(後で設定画面に貼り付けます)。

Anthropic APIキー(翻訳・提案・要約)

  1. console.anthropic.com にアクセスしてサインアップ/ログインします(支払い設定が必要です)。
  2. 「API Keys」から新しいキーを作成します。
  3. 表示されたキーをコピーしておきます。
注意: APIキーは秘密情報です。第三者に共有したり、ソースコードやチャットに貼り付けたりしないでください。 アプリ内に入力したキーは、OSの暗号化機構(Electron safeStorage)でローカルに暗号化保存されます。

4. インストールと起動

方法A:ビルド済みアプリを使う(Windows 配布版)

配布された release/ 内のインストーラー(NSIS)またはポータブル版 .exe を実行します。インストール後はアイコンから起動できます。

方法B:ソースから動かす(開発者向け)

# 依存関係のインストール
npm install

# ビルド(TypeScript → dist/)
npm run build

# 起動
npm start

主なコマンド:

コマンド用途
npm startビルドして起動
npm run buildTypeScript をコンパイル
npm testテスト実行(Vitest)
npm run dist:winWindows 配布物をビルド(release/ に出力)
npm run replay -- file.wav録音WAVで動作確認(会議なしでテスト)

5. 初回設定

  1. アプリを起動し、右上の (設定)を開きます。
  2. Deepgram APIキーAnthropic APIキー をそれぞれ入力します。
  3. 音声ソース を選びます。Windowsの会議音声を翻訳するなら 「システム音声(Windows)」、マイクで試すなら「マイク(開発用)」。
  4. 必要に応じて翻訳モデル不透明度などを調整します。
  5. 保存 を押します。キーが正しく保存されると「(設定済み)」と表示されます。
開発時は環境変数 DEEPGRAM_API_KEY / ANTHROPIC_API_KEY でキーを渡すこともできます。

6. 画面の見かた

起動すると、以下のような枠なしオーバーレイが表示されます(実際の配色・レイアウトを再現)。

録音中 02:14 connected 💾
立場 営業担当者
価格について、年間契約だと割引はありますか?
Is there a discount for an annual contract?
来四半期に新機能をリリース予定です。
We plan to release new features next quarter.
we're currently looking into…
これまでのハイライト
14:32 | 価格と契約条件
  • 年間契約での割引を確認
  • 新機能は来四半期予定
質問・確認事項
📌 年間契約の最低利用期間は?
EN: What is the minimum term for an annual contract?
📌 ✕
新機能の具体的なリリース時期は?
EN: When exactly will the new features ship?
📌 ✕

▲ 実際のUIを再現したイメージ

場所名称説明
左上 録音ボタン録音の開始/停止。録音中は赤く点灯し、経過時間を表示。
上部接続状態ランプ緑=接続中/黄=再接続中/灰=未接続/赤=エラー。
右上💾 ログ保存/設定/最小化/終了。
その下立場(役割) で編集。提案の最適化に使われます。
左パネル字幕日本語訳(大)と英語原文(青灰・小)。認識途中の文は斜体で表示。
右上パネルハイライト会話要点の自動要約。 で手動更新。
右下パネル質問・確認事項提案カード。新着が上。📌でピン留め、✕で削除。

7. 基本的な使い方

  1. 会議を開始し、音声が再生される状態にします(Windowsの場合は「システム音声」を選択)。
  2. アプリの を押して録音を開始します。接続ランプが緑になれば動作中です。
  3. 左パネルに字幕(英語+日本語訳)が流れ始めます。
  4. 右下に質問・確認事項が自動で提案されます。良いものは 📌ピン留め。英語表現は EN ▼ で表示/非表示。不要なら で削除。
  5. 右上にハイライトが蓄積されていきます。
  6. 会議が終わったら再度 停止します。
  7. 💾 を押すと、英語原文+日本語訳の全文を Markdownログとして保存できます。
立場(役割)を設定すると提案の質が上がります。 例:「営業担当者」「エンジニア」「採用面接官」など、 自分の視点を一言で入れておくと、その立場で聞くべき質問が提案されます。

8. 設定項目の詳細

設定説明既定値
翻訳モデル字幕の日本語訳に使う Claude モデルHaiku
サジェストモデル質問・確認事項の生成に使うモデルHaiku
サジェスト間隔(秒)提案を生成する頻度(3〜60秒)8秒
サマリーモデルハイライト生成に使うモデルHaiku
サマリー間隔(秒)ハイライト生成の頻度(30〜600秒)90秒
背景の不透明度ウィンドウの透け具合(0.3〜1.0、リアルタイム反映)0.9
常に最前面に表示他アプリより前面に固定するかON
音声ソースマイク(開発用)/システム音声(Windows)マイク
Deepgram APIキー音声認識用キー(暗号化保存)
Anthropic APIキー翻訳・提案・要約用キー(暗号化保存)
用語集1行1項目「英語 = 訳語」形式で登録

用語集の書き方

社内用語や固有名詞の訳をブレなくするために登録します。1行に1項目、英語 = 日本語 の形式です。

ARR = 年間経常収益
Q1 = 第1四半期
churn = 解約率

9. モデル選択とコスト

翻訳・提案・要約はそれぞれ独立してモデルを選べます。リアルタイム性とコスト重視なら Haiku、品質重視なら Sonnet / Opus。

モデル特徴向いている用途
Haiku高速・低コスト(既定)リアルタイム字幕、日常的な会議
Sonnetバランス型翻訳品質を上げたいとき
Opus最高品質重要商談・専門性の高い会議
Deepgram・Anthropic はいずれも従量課金です。使用量に応じて費用が発生します。 まずは Haiku で運用し、必要に応じて翻訳モデルだけ Sonnet/Opus に上げるのがおすすめです。 料金は各社の最新の価格表をご確認ください。

10. 便利な使い方

11. トラブルシューティング

症状対処
字幕が出ないAPIキーが設定済みか、音声ソースが正しいか確認。Windowsはシステム音声デバイスを確認。
接続ランプが黄色(再接続中)ネットワークの一時的な切断。自動で再接続を試みます。続く場合は回線を確認。
接続ランプが赤(エラー)翻訳APIのエラー。キー・残高・利用制限を確認。英語原文は表示が継続されます。
起動失敗(マイク許可等)OSのマイク/画面収録の権限を確認してください。
動作が重い・コストが気になる各モデルを Haiku に、サジェスト/サマリー間隔を長めに設定。
提案が的外れ「立場」をより具体的に設定し、用語集を充実させる。

12. 仕組み(参考)

内部では音声からの処理が複数のレーンに分かれて並行動作します。

会議音声
   ↓ 音声キャプチャ(16kHz PCM)
Deepgram STT  →  英語テキスト(途中経過+確定)
   ↓
フラグメント結合(短い相槌などを整理)
   ↓
┌──────────────┬──────────────┬──────────────┐
│ 翻訳レーン    │ 提案レーン     │ 要約レーン     │
│ 英→日 翻訳    │ 質問を約8秒毎  │ ハイライトを   │
│              │ に生成         │ 約90秒毎に生成 │
└──────────────┴──────────────┴──────────────┘
   ↓
画面表示(字幕・質問・ハイライト)+ Markdown ログ