meeting-translator 取扱説明書
英語会議のリアルタイム翻訳&質問サジェスト・オーバーレイ
meeting-translator は、Zoom / Teams / Google Meet などの英語会議の音声をリアルタイムに
文字起こし・日本語訳し、画面の最前面に字幕として重ねて表示するデスクトップアプリ(Windows 向け)です。
さらに 「いま聞くべき質問・確認事項」 と 会話のハイライト を AI が自動生成し、
英語が苦手でも会議に主体的に参加できるよう支援します。
1. できること
- リアルタイム字幕:話者の英語をその場で文字起こしし、日本語訳を逐次表示します。
- 質問・確認事項のサジェスト:会話の文脈から「いま聞くと良い質問」を日本語+英語表現つきで自動提案します(既定で約8秒ごと)。
- ハイライト(要約):会話の要点を一定間隔で自動要約し、時系列で蓄積します(既定で約90秒ごと)。
- ピン留め:重要な質問カードを固定エリアに留めて、流れても見失わないようにできます。
- 立場の設定:あなたの役割(例:営業担当者)を伝えると、提案がその立場に最適化されます。
- 用語集:社内用語・固有名詞の訳語を登録して翻訳精度を上げられます。
- ログ保存:英語原文+日本語訳の全文を Markdown ファイルとして保存できます。
- 常に最前面・半透明表示:会議ウィンドウに重ねて使える、枠なしオーバーレイUI。
2. 動作環境・技術構成
| 項目 | 内容 |
| 対応OS | Windows(システム音声キャプチャに対応)。開発・動作確認は macOS でもマイク入力で可能。 |
| アプリ形態 | Electron 製デスクトップアプリ(枠なし・半透明・常に最前面) |
| 音声認識(STT) | Deepgram(Nova-3 モデル、ストリーミング) |
| 翻訳・提案・要約 | Anthropic Claude(Haiku / Sonnet / Opus を選択可) |
| 必要なもの | Deepgram APIキー + Anthropic APIキー(いずれも従量課金) |
ElectronTypeScript
Deepgram Nova-3Claude API
Web Audio API
3. APIキーの取得
本アプリの利用には、音声認識用と翻訳用の2つのAPIキーが必要です。先に取得しておきましょう。
Deepgram APIキー(音声認識)
- console.deepgram.com にアクセスしてサインアップ/ログインします。
- プロジェクトを選択(または新規作成)します。
- 「API Keys」から新しいキーを作成します。
- 表示されたキーをコピーしておきます(後で設定画面に貼り付けます)。
Anthropic APIキー(翻訳・提案・要約)
- console.anthropic.com にアクセスしてサインアップ/ログインします(支払い設定が必要です)。
- 「API Keys」から新しいキーを作成します。
- 表示されたキーをコピーしておきます。
注意: APIキーは秘密情報です。第三者に共有したり、ソースコードやチャットに貼り付けたりしないでください。
アプリ内に入力したキーは、OSの暗号化機構(Electron safeStorage)でローカルに暗号化保存されます。
4. インストールと起動
方法A:ビルド済みアプリを使う(Windows 配布版)
配布された release/ 内のインストーラー(NSIS)またはポータブル版 .exe を実行します。インストール後はアイコンから起動できます。
方法B:ソースから動かす(開発者向け)
# 依存関係のインストール
npm install
# ビルド(TypeScript → dist/)
npm run build
# 起動
npm start
主なコマンド:
| コマンド | 用途 |
npm start | ビルドして起動 |
npm run build | TypeScript をコンパイル |
npm test | テスト実行(Vitest) |
npm run dist:win | Windows 配布物をビルド(release/ に出力) |
npm run replay -- file.wav | 録音WAVで動作確認(会議なしでテスト) |
5. 初回設定
- アプリを起動し、右上の ⚙(設定)を開きます。
- Deepgram APIキー と Anthropic APIキー をそれぞれ入力します。
- 音声ソース を選びます。Windowsの会議音声を翻訳するなら 「システム音声(Windows)」、マイクで試すなら「マイク(開発用)」。
- 必要に応じて翻訳モデルや不透明度などを調整します。
- 保存 を押します。キーが正しく保存されると「(設定済み)」と表示されます。
開発時は環境変数 DEEPGRAM_API_KEY / ANTHROPIC_API_KEY でキーを渡すこともできます。
6. 画面の見かた
起動すると、以下のような枠なしオーバーレイが表示されます(実際の配色・レイアウトを再現)。
◉
録音中 02:14
connected
💾⚙—✕
立場
営業担当者
✏
価格について、年間契約だと割引はありますか?
Is there a discount for an annual contract?
来四半期に新機能をリリース予定です。
We plan to release new features next quarter.
we're currently looking into…
これまでのハイライト↻
質問・確認事項↻
📌 年間契約の最低利用期間は?
EN: What is the minimum term for an annual contract?
📌 ✕
新機能の具体的なリリース時期は?
EN: When exactly will the new features ship?
📌 ✕
▲ 実際のUIを再現したイメージ
| 場所 | 名称 | 説明 |
| 左上 | ◉ 録音ボタン | 録音の開始/停止。録音中は赤く点灯し、経過時間を表示。 |
| 上部 | 接続状態ランプ | 緑=接続中/黄=再接続中/灰=未接続/赤=エラー。 |
| 右上 | 💾 ⚙ — ✕ | ログ保存/設定/最小化/終了。 |
| その下 | 立場(役割) | ✏ で編集。提案の最適化に使われます。 |
| 左パネル | 字幕 | 日本語訳(大)と英語原文(青灰・小)。認識途中の文は斜体で表示。 |
| 右上パネル | ハイライト | 会話要点の自動要約。↻ で手動更新。 |
| 右下パネル | 質問・確認事項 | 提案カード。新着が上。📌でピン留め、✕で削除。 |
7. 基本的な使い方
- 会議を開始し、音声が再生される状態にします(Windowsの場合は「システム音声」を選択)。
- アプリの ◉ を押して録音を開始します。接続ランプが緑になれば動作中です。
- 左パネルに字幕(英語+日本語訳)が流れ始めます。
- 右下に質問・確認事項が自動で提案されます。良いものは 📌 でピン留め。英語表現は EN ▼ で表示/非表示。不要なら ✕ で削除。
- 右上にハイライトが蓄積されていきます。
- 会議が終わったら再度 ◉ で停止します。
- 💾 を押すと、英語原文+日本語訳の全文を Markdownログとして保存できます。
立場(役割)を設定すると提案の質が上がります。 例:「営業担当者」「エンジニア」「採用面接官」など、
自分の視点を一言で入れておくと、その立場で聞くべき質問が提案されます。
8. 設定項目の詳細
| 設定 | 説明 | 既定値 |
| 翻訳モデル | 字幕の日本語訳に使う Claude モデル | Haiku |
| サジェストモデル | 質問・確認事項の生成に使うモデル | Haiku |
| サジェスト間隔(秒) | 提案を生成する頻度(3〜60秒) | 8秒 |
| サマリーモデル | ハイライト生成に使うモデル | Haiku |
| サマリー間隔(秒) | ハイライト生成の頻度(30〜600秒) | 90秒 |
| 背景の不透明度 | ウィンドウの透け具合(0.3〜1.0、リアルタイム反映) | 0.9 |
| 常に最前面に表示 | 他アプリより前面に固定するか | ON |
| 音声ソース | マイク(開発用)/システム音声(Windows) | マイク |
| Deepgram APIキー | 音声認識用キー(暗号化保存) | — |
| Anthropic APIキー | 翻訳・提案・要約用キー(暗号化保存) | — |
| 用語集 | 1行1項目「英語 = 訳語」形式で登録 | 空 |
用語集の書き方
社内用語や固有名詞の訳をブレなくするために登録します。1行に1項目、英語 = 日本語 の形式です。
ARR = 年間経常収益
Q1 = 第1四半期
churn = 解約率
9. モデル選択とコスト
翻訳・提案・要約はそれぞれ独立してモデルを選べます。リアルタイム性とコスト重視なら Haiku、品質重視なら Sonnet / Opus。
| モデル | 特徴 | 向いている用途 |
| Haiku | 高速・低コスト(既定) | リアルタイム字幕、日常的な会議 |
| Sonnet | バランス型 | 翻訳品質を上げたいとき |
| Opus | 最高品質 | 重要商談・専門性の高い会議 |
Deepgram・Anthropic はいずれも従量課金です。使用量に応じて費用が発生します。
まずは Haiku で運用し、必要に応じて翻訳モデルだけ Sonnet/Opus に上げるのがおすすめです。
料金は各社の最新の価格表をご確認ください。
10. 便利な使い方
- ピン留めを活用:本当に聞きたい質問は 📌 で固定。新着提案が流れても見失いません。
- 英語表現をその場で確認:提案の EN ▼ を開けば、そのまま口頭で使える英語フレーズが見られます。
- 不透明度を下げる:会議資料に重ねて使うときは背景を薄くすると見やすくなります。
- 手動更新:もっと提案/要約が欲しいときは各パネルの ↻ で即生成。
- ログを議事録に:保存した Markdown はそのまま議事録のたたき台になります。
11. トラブルシューティング
| 症状 | 対処 |
| 字幕が出ない | APIキーが設定済みか、音声ソースが正しいか確認。Windowsはシステム音声デバイスを確認。 |
| 接続ランプが黄色(再接続中) | ネットワークの一時的な切断。自動で再接続を試みます。続く場合は回線を確認。 |
| 接続ランプが赤(エラー) | 翻訳APIのエラー。キー・残高・利用制限を確認。英語原文は表示が継続されます。 |
| 起動失敗(マイク許可等) | OSのマイク/画面収録の権限を確認してください。 |
| 動作が重い・コストが気になる | 各モデルを Haiku に、サジェスト/サマリー間隔を長めに設定。 |
| 提案が的外れ | 「立場」をより具体的に設定し、用語集を充実させる。 |
12. 仕組み(参考)
内部では音声からの処理が複数のレーンに分かれて並行動作します。
会議音声
↓ 音声キャプチャ(16kHz PCM)
Deepgram STT → 英語テキスト(途中経過+確定)
↓
フラグメント結合(短い相槌などを整理)
↓
┌──────────────┬──────────────┬──────────────┐
│ 翻訳レーン │ 提案レーン │ 要約レーン │
│ 英→日 翻訳 │ 質問を約8秒毎 │ ハイライトを │
│ │ に生成 │ 約90秒毎に生成 │
└──────────────┴──────────────┴──────────────┘
↓
画面表示(字幕・質問・ハイライト)+ Markdown ログ
- 文脈考慮:直近の会話履歴を踏まえて翻訳・提案します。
- 重複抑制:直近の提案・要約と重複しないよう調整します。
- プロンプトキャッシュ:API コストを抑える最適化を行っています。
- 自動再接続:音声認識が切れても指数バックオフで復帰を試みます。