AI要約抽出 - SeaMeetに議事録を任せましょう
第28章:AI要約抽出 — SeaMeetに議事録を任せましょう
すべての会議に同席して要約を書き、アクションアイテムをまとめ、重要な決定事項をフラグ立てし、話題の変わり目にタイムスタンプを付けてくれるアシスタントを雇うことを想像してみてください——あなたは会話に集中するだけでいい。これがまさにAI要約抽出の機能です。ライブラリ内の任意の録音を指定すると、5つの構造化された出力が返されます:完全な文字起こし、簡潔な要約、アクションアイテム、重要な決定事項、タイムスタンプ付きチャプター。
入力不要。巻き戻し不要。何が決まったか推測する必要もありません。
本章の目標
この章を読み終えると、以下のことができるようになります:
- AI要約抽出が生成するものと使用するタイミングを理解する
- 前提条件を設定する
- 最初の抽出を生成する
- 5つの出力タブを操作して使用する
- スクリーンショットOCRを使用してテキストを自動抽出し、クリップボードにコピーする
- 結果を再生成し、以前のバージョンがどのように保存されるかを理解する
- 複数のフォーマットで結果をエクスポートする
- よくある抽出の問題をトラブルシューティングする
AI要約抽出とは?
AI要約抽出は録音後の分析プロセスです。録音が完了した後、ワンクリックで起動できます。AIエンジンが音声を処理し、5つの構造化された出力を返します:
| タブ | 内容 |
|---|---|
| Transcript | タイムスタンプ付きの逐語テキスト |
| Summary | 議論内容の簡潔なまとめ |
| Actions | 会話から特定されたタスク(担当者と期限が言及された場合は含む) |
| Decisions | 会議中に下された重要な選択 |
| Chapters | 時間インデックス付きのトピックセグメント——本やDVDのチャプターのようなもの |
こう考えてみてください: 録音は生の映像素材です。AI要約抽出は、それを見て構造化された使いやすいものに変える編集者です。
AI要約抽出はライブラリ内の任意の録音で機能します——録音中にライブ文字起こしを使用したかどうかに関わらず。ライブ文字起こしを実行した場合でも、抽出機能は有用な2回目の処理として機能し、ライブ文字起こし単体では提供されない要約や構造化された出力を生成します。
始める前に
必要条件
- AI機能が有効: 設定 → AI → オンに切り替え
- APIキーが設定済み: 設定 → AI → APIキーフィールド(緑のチェックマーク = 有効)
- 抽出中は有効なインターネット接続
- ライブラリ内に録音がある — SeaMeetが録音またはインポートした任意の音声または動画ファイル
抽出にかかる時間は?
処理時間は録音の長さに応じて変わります:
| 録音の長さ | おおよその時間 |
|---|---|
| 15分未満 | 20〜40秒 |
| 15〜60分 | 1〜3分 |
| 1〜2時間 | 3〜6分 |
| 2時間超 | 5〜10分 |
これらは目安です。実際の時間はサーバーの負荷とインターネットの速度によって異なります。
最初の抽出を生成する
-
録音ライブラリから録音を開く
- 表示内容: 録音の詳細パネルが右側に開き、プレーヤーと録音情報が表示されます。
-
詳細パネルで「AI Insights」タブをクリック
- 表示内容: AI Insightsパネルが表示されます。まだ抽出が実行されていない場合は、✨アイコンが付いた "Generate Summary" プロンプトが表示されます。
-
✨ "Generate Summary" をクリック
- 表示内容: ボタンのラベルがスピナーに変わります。AIがコンテンツを処理するにつれて、プログレスバーまたはステータスメッセージ("Analysing audio…"、"Generating summary…")が更新されます。
-
結果を待つ
- 表示内容: 完了すると、5つのタブにコンテンツが表示されます。AI Insightsパネルの上部にあるタブバーには:Transcript · Summary · Actions · Decisions · Chapters が表示されます。
-
タブを閲覧する(各タブで確認すべき点については以下のセクションを参照)
各タブを理解する
文字起こし(Transcript)
Transcriptタブには、タイムスタンプと話者ラベルで区切られたセグメントで、録音の完全な逐語テキストが表示されます。
┌──────────────────────────────────────────────────────────┐
│ Transcript │ Summary │ Actions │ Decisions │ Chapters │
├──────────────────────────────────────────────────────────┤
│ 話者 1 ► 0:00:08 │
│ 「おはようございます、皆さん。Q3予算 │
│ レビューを始めましょう。」 │
│ │
│ 話者 2 ► 0:00:21 │
│ 「ありがとうございます。スライドを │
│ 準備しました。収益から始めますか、 │
│ それとも支出から?」 │
│ │
│ 話者 1 ► 0:00:30 │
│ 「収益から始めましょう。Alice、説明して │
│ もらえますか?」 │
└──────────────────────────────────────────────────────────┘
タイムスタンプをクリック(各セグメントの横にある ► 0:00:08 リンク)すると、音声/動画プレーヤーがその正確な時点にジャンプします。これにより、手動でスクラブすることなく、引用を確認したり特定の議論を見つけたりすることが速くできます。
話者ラベルはデフォルトで「話者 1」、「話者 2」などになっています。これらは変更できます——第29章を参照してください。
要約(Summary)
Summaryタブには、録音で起きたことの簡潔な叙述が含まれています。文字起こされた言葉の箇条書きリストではなく——議論された主なポイントを捉えた総合的な概要です。
例(45分の予算会議):
チームはQ3の収益実績をレビューし、予測比8%上回る結果となりました。マーケティング予算の支出超過がQ4に向けての主な懸念事項として特定されました。Aliceが有料広告費を15%削減することを提案し、財務部門の最終承認待ちで受け入れられました。グループは改訂された予測を確認するため、翌火曜日に再度会議を開くことに合意しました。
要約は共有可能なように設計されています——編集なしにメール、プロジェクト管理ツール、またはドキュメントにそのままコピーできます。
アクションアイテム(Actions)
Actionsタブには、録音中に明示的または暗黙的に割り当てられたタスクが一覧表示されます。
┌──────────────────────────────────────────────────────────┐
│ アクションアイテム │
├──────────────────────────────────────────────────────────┤
│ □ 有料広告費を15%削減する │
│ 担当:Alice · 期限:火曜日の会議前 │
│ ► 0:32:14(録音内) │
│ │
│ □ 改訂されたQ4予測をチームに送付する │
│ 担当:財務チーム · 期限:金曜日 │
│ ► 0:41:08(録音内) │
│ │
│ □ 火曜日のフォローアップ会議をスケジュールする │
│ 担当:(未指定) · 期限の言及なし │
│ ► 0:43:55(録音内) │
└──────────────────────────────────────────────────────────┘
各アクションアイテムには以下が含まれます:
- タスク — 何をする必要があるか
- 担当者 — 誰に依頼されたか(言及された場合)
- 期限 — いつまでに必要か(言及された場合)
- タイムスタンプリンク — 録音内でこれが議論された場所にジャンプ
注意: AIは発言された内容からアクションアイテムを抽出します。議論されたが明確な割り当てがなかった場合、ここに表示されない場合があります。録音または文字起こしと照合して必ず確認してください。
決定事項(Decisions)
Decisionsタブには、録音中に達した重要な選択と合意が一覧表示されます。
┌──────────────────────────────────────────────────────────┐
│ 決定事項 │
├──────────────────────────────────────────────────────────┤
│ ✓ Q4有料広告費の15%削減を承認 │
│ ► 0:32:14 │
│ │
│ ✓ Q3収益実績を最終値として承認(再計算なし) │
│ ► 0:12:45 │
│ │
│ ✓ 火曜日のフォローアップ会議を確認 │
│ ► 0:43:55 │
└──────────────────────────────────────────────────────────┘
決定事項はアクションアイテムとは異なります:決定事項は合意されたことであり、アクションアイテムはその結果として誰かが行う必要があることです。
チャプター(Chapters)
Chaptersタブは、録音を時間インデックス付きのトピックセグメントに分割します。本のチャプターやDVDのチャプターのようなものです。
┌──────────────────────────────────────────────────────────┐
│ チャプター │
├──────────────────────────────────────────────────────────┤
│ ► 0:00:00 イントロダクションと事務連絡 3分 │
│ ► 0:03:10 Q3収益レビュー 12分 │
│ ► 0:15:22 費用分析 — マーケティング 10分 │
│ ► 0:25:41 Q4予算提案 18分 │
│ ► 0:43:30 まとめと次のステップ 4分 │
└──────────────────────────────────────────────────────────┘
任意のチャプターをクリックすると、プレーヤーがそのトピックの開始時間にジャンプします。予算提案の議論だけを聞き直したい場合は、► 0:25:41 をクリックしてください。
チャプターは、特定のトピックをすばやく見つけたい長い録音に特に役立ちます。
AIによるファイル名の変更提案
AI要約抽出が完了すると、AIは会議の内容に基づいて、録音に対してより説明的なファイル名を提案する場合があります。AI Insightsパネルの上部にバナーが表示されます:
┌──────────────────────────────────────────────────────────────┐
│ 新しいファイル名:Q3予算レビュー — 10月15日チーム会議 │
│ [ Rename ] │
└──────────────────────────────────────────────────────────────┘
提案された名前を適用するには:
- Rename をクリック — 録音ファイルとライブラリエントリが即座に 名前変更されます。
- 名前変更後、提案バナーは消えます。
元の名前を維持するには:
- バナーを無視してください — 自動適用されず、ページを離れると消えます。
注意: 提案は会議の内容に基づいています。一般的または短い録音の場合、提案された名前は元の名前と似ている場合があります。最終決定権は常にあなたにあります。
Geminiモデルの選択
SeaMeetはGoogleのAPIから利用可能なGeminiモデルを動的に取得します——Googleが新しいバージョンをリリースするたびにモデルリストは最新の状態に保たれます。
使用されるモデル:
- SeaMeetは自動的にテキスト、ビジョン、音声をサポートするモデルをフィルタリング します(会議分析に必要)
- 機能が充実した現行モデルのみが表示されます——古いモデルや制限のあるモデルは除外されます
- リストは最新/最も高機能なモデルが最初に来るよう並び替えられます
設定 → AI → モデル で使用中のモデルを確認および変更できます。デフォルトは最も高機能な利用可能モデルです。コスト削減や特定のモデルの制限を回避する必要がない限り、これを変更する理由はほとんどありません。
スクリーンショットOCR — テキストを自動抽出してクリップボードにコピー
AI要約抽出は音声録音に限りません。**「Extract text (OCR) and copy to clipboard」**オプションを有効にしてスクリーンショットを撮ると、SeaMeetは自動的にキャプチャした画像にOCRを実行し、抽出したテキストをクリップボードにコピーします。
仕組み
- キャプチャ前: Capture Hubまたはリージョンセレクターオーバーレイで**「Extract text (OCR) and copy to clipboard」**チェックボックスにチェックを入れます
- スクリーンショットを撮影(フルスクリーンまたはエリアキャプチャ)
- 約15〜30秒待ちます — AIパイプラインがバックグラウンドで画像を処理
- テキストがクリップボードにコピーされます — 通知で「抽出されたテキストがクリップボードにコピーされました」と確認
- どこにでも貼り付け — Cmd+V / Ctrl+Vで抽出されたテキストを貼り付け
OCRパイプラインは完全にバックグラウンドで実行されます。処理中もSeaMeetを使い続けたり、他のアプリに切り替えたりできます。抽出が完了すると、クリップボードは自動的に更新されます。
設定場所
OCR自動コピーオプションは3か所に表示されます:
| 場所 | 制御内容 |
|---|---|
| Capture Hub(スクリーンショットパネル) | キャプチャごとの切り替え — キャプチャモードセレクター下のチェックボックス |
| リージョンセレクターオーバーレイ | キャプチャごとの切り替え — 「Capture Screen or Press Enter」近くのチェックボックス |
| 設定 → AI Extraction & Summary | デフォルトのオン/オフ — 「Auto-extract text (OCR) on screenshot」トグル |
3か所すべてが同期されます。いずれかの場所で切り替えると、他も更新されます。
必要条件
- Gemini APIキーが設定済み(または管理キー付きの有効なサブスクリプション)
- 設定でAI機能が有効
APIキーが利用できない場合、チェックボックスはグレーアウトされ、「(APIキーが必要です、こちらでサブスクライブ)」とサブスクリプションポータルへのリンクが表示されます。
抽出される内容
OCRパイプラインはスクリーンショット内のすべての可視テキストを抽出します — 以下を含む:
- UIラベル、メニュー、ボタン
- ドキュメントやウェブページのコンテンツ
- エラーメッセージやダイアログのテキスト
- コードやターミナル出力
- 手書きテキスト(判読可能な場合)
抽出されたテキストは、スクリーンショットのAI抽出パネルの**Text (OCR)**タブにも保存されるので、後で確認 したり再コピーしたりできます。
再生成
結果に満足できない場合、または話者の名前を変更した後に新しい分析が欲しい場合は、再生成できます。
-
タブバーの⟳(再生成)ボタンをクリック
- 表示内容: ボタンが回転します。コンテンツが短い「処理中…」の通知に一時的に置き換わります。
-
待機する(最初の生成と同じ時間)
- 表示内容: 5つのタブすべてが新しい結果で更新されます。
-
新しい結果を確認する
重要: 結果を上書きする前に、SeaMeetは自動的に前の抽出をバージョンスナップショットとしてアーカイブします。何も失われることはありません。過去のバージョンはいつでも閲覧できます——第29章B節を参照してください。
エクスポート
タブバーにはエクスポートボタンがあり、SeaMeetの外部に結果を持ち出すことができます:
[Transcript] [Summary] [Actions] [Decisions] [Chapters] · [MD] [SRT] [JSON] [⟳]
| ボタン | フォーマット | 最適な用途 |
|---|---|---|
| MD | Markdown | メモアプリ(Notion、Obsidian)、ドキュメント |
| SRT | SubRipサブタイトル | 動画ファイルへのキャプション追加(iMovie、Premiere、YouTube) |
| JSON | JSONデータ | 開発者、他のツールへのインポート |
アクティブなタブによってエクスポートされる内容が決まります:
- Summaryタブ → MDで要約テキストをエクスポート
- Transcriptタブ → SRTでタイムスタンプ付き文字起こしをサブタイトルとしてエクスポート
- Actionsタブ → MDまたはJSONでアクションアイテムリストをエクスポート
ヒント: 現在の結果の独立したコピーが欲しい場合は、再生成前にエクスポートしてください——ただし、バージョン履歴が過去の結果を自動的に保存するため、これは厳密には必要ありません(第29章を参照)。
トラブルシューティング
「抽出に失敗しました」
症状: スピナーが停止し、エラーメッセージが表示される:「Extraction failed」または「Something went wrong」。
次の順序でお試しください:
- インターネット接続を確認 — ウェブページの読み込みを試みる
- APIキーがまだ有効であることを確認(設定 → AI → 緑のチェックマークを確認)
- 2〜3分待ってから再試行 — AIサービスが一時的に過負荷になっている可能性があります
- 録音が非常に長い(2時間以上)場合は、分割するか処理時間を多めに確保してみてください
「要約が不完全に見える」
症状: 要約が短い、重要なトピックが抜けている、または一般的すぎる。
考えられる原因:
- 音声品質が悪かった — 文字起こしエラーが抽出エラーにつながります。Transcriptタブで文字化けしたセグメントを確認してください。
- 録音で捉えた音声が少なすぎた — システム音声が主体だった場合(音楽、動画再生)、AIが処理できる音声が少なかった可能性があります
- 非常に短い録音 — 2分未満の録音は限られた要約しか生成されません
試すべきこと:
- 話者の名前を変更して文字起こしを確認した後、⟳で抽出を再実行する
- 今後の録音のためにマイクの位置を改善する
「アクションアイテムが空白」
症状: タスクが明確に割り当てられた会議の 後でも、Actionsタブが空白。
起きていること: AIは明確な言語(「〜できますか」、「私が対応します」、「確認しましょう」)からアクションアイテムを抽出します。暗黙的または非公式なコミットメントは見逃される場合があります。
試すべきこと:
- Transcriptタブを確認してください——会話が非公式だった場合、AIは明確な行動言語を識別できなかった可能性があります
- これは、構造化された会議ではなく、カジュアルで探索的な会話では予期される動作です
ベストプラクティス
高品質な音声 → より良い結果 すべての抽出ステップは文字起こしの精度に依存します。静かな部屋で高品質なマイクを使用して録音したものは、背景ノイズとエコーがあるものと比べて、劇的に優れた結果を生み出します。定期的な会議録音には、まとも なヘッドセットマイクへの投資をお勧めします。
マイクとシステム音声の両方を録音する 仮想会議(Zoom、Teams、Google Meet)を録音している場合は、「両方」の音声モードを使用して、システム音声(他の参加者)がマイクと一緒に捉えられるようにしてください。片側だけの会話からの抽出は、片側だけの結果しか生み出しません。
再生成前に話者の名前を変更する 話者名はSummaryとActionsタブに表示されます。⟳をクリックする前に「話者 1」を「Alice」に変更することで、はるかに読みやすい要約が生成されます。話者の名前変更方法については第29章を参照してください。
長い録音ほど豊かな要約が生成される 5分間の会議は短い要約しか生成しません。45分間の戦略的議論は、明確なセクションを持つ詳細で構造化された要約を生成します。AI要約抽出は、実質的なコンテンツのある録音で最も価値を発揮します。
ナビゲーションにチャプターを活用する 20分を超える録音については、常にChaptersタブを最初に確認してください。議論の地図が提供され、気になるセクションにジャンプするのがはるかに速くなります。
クイックリファレンス
┌────────────────────────────────────────────────────────────┐
│ AI要約抽出 │
│ クイックリファレンス │
├────────────────────────────────────────────────────────────┤
│ 起動 │ AI Insightsタブ → ✨ Generate Summary │
│ 再生成 │ タブバーの⟳ボタン │
│ 過去の結果 │ 安全にアーカイブ済み — 第29章を参照 │
├────────────────────────────────────────────────────────────┤
│ Transcript │ 完全なテキスト + タイムスタンプ、クリックでジャンプ │
│ Summary │ 議論の叙述的な概要 │
│ Actions │ タスク + 担当者 + 期限 │
│ Decisions │ 合意事項と選択 │
│ Chapters │ 時間インデックス付きトピックマップ、クリックでジャンプ │
├────────────────────────────────────────────────────────────┤
│ エクスポート:MD │ Markdown — メモアプリ向け │
│ エクスポート:SRT │ サブタイトル — 動画編集向け │
│ エクスポート:JSON │ 構造化データ — 開発者向け │
├────────────────────────────────────────────────────────────┤
│ スクリーンショットOCR │ テキスト自動抽出 + クリップボードにコピー │
│ OCR設定 │ Capture Hubチェックボックスまたは設定 → AI │
├────────────────────────────────────────────────────────────┤
│ 必要条件 │ インターネット + AI機能オン + APIキー │
│ 対象 │ 任意の録音またはスクリーンショット │
└────────────────────────────────────────────────────────────┘
最終更新:2026-03-27
Published: