第28章：AI提取 — 让SeaMeet帮您做会议记录

想象一下，雇一位助理参加每次会议，撰写摘要、提取行动项目、标记关键决策，并为每个话题变换打上时间戳——而您只需专注于对话。这正是AI提取所做的事。将其指向您库中的任何录音，它会返回五种结构化输出：完整转录、简洁摘要、行动项目、关键决策和带时间戳的章节。

无需输入。无需倒带。无需猜测决定了什么。

章节目标

阅读本章后，您将能够：

了解AI提取产生什么以及何时使用
设置先决条件
生成您的第一个提取结果
导航并使用五个输出选项卡中的每一个
使用截图 OCR 自动提取文字并复制到剪贴板
重新生成结果并了解如何保留以前的版本
以多种格式导出结果
解决常见的提取问题

什么是AI提取？

AI提取是一个录音后分析过程。录音完成后，只需单击一次即可触发。AI引擎处理音频并返回五种结构化输出：

选项卡	内容
Transcript	所有发言内容的逐字文本及时间戳
Summary	讨论内容的简洁叙述
Actions	从对话中识别出的任务，包含提及的负责人和截止日期
Decisions	会议期间做出的关键选择
Chapters	按时间索引的话题片段——就像书中的章节

这样理解： 录音是原始素材。AI提取是观看素材并将其转化为结构化、可用内容的编辑。

AI提取适用于您库中的任何录音——无论您在录制时是否使用了实时转录。如果实时转录已运行，提取仍可作为有用的第二次处理，产生实时转录单独无法提供的摘要和结构化输出。

开始之前

要求

AI功能已启用： 设置 → AI → 开启
已配置API密钥： 设置 → AI → API密钥字段（绿色对勾 = 有效）
提取期间需要有效的互联网连接
库中有录音 — SeaMeet录制或导入的任何音频或视频文件

提取需要多长时间？

处理时间随录音长度增加：

录音时长	大致时间
15分钟以内	20–40秒
15–60分钟	1–3分钟
1–2小时	3–6分钟
超过2小时	5–10分钟

这些是估计值。实际时间取决于服务器负载和您的网络速度。

生成您的第一个提取结果

从录音库打开一个录音
- 您看到什么： 录音详情面板在右侧打开，显示播放器和录音信息。
在详情面板中点击"AI Insights"选项卡
- 您看到什么： AI Insights面板出现，如果还没有运行过提取，会显示"Generate Summary"提示。✨图标标记该按钮。
点击✨ "Generate Summary"
- 您看到什么： 按钮标签变为加载动画。进度条或状态消息（"Analysing audio…"、"Generating summary…"）在AI处理内容时更新。
等待结果
- 您看到什么： 完成后，五个选项卡填充内容。AI Insights面板顶部的选项卡栏显示：Transcript · Summary · Actions · Decisions · Chapters。
浏览选项卡（参见下文各部分了解每个选项卡中需要查看的内容）

理解每个选项卡

Transcript（转录）

Transcript选项卡显示录音的完整逐字文本，分为带有时间戳和说话人标签的片段。

┌──────────────────────────────────────────────────────────┐
│  Transcript  │  Summary  │  Actions  │  Decisions  │  Chapters │
├──────────────────────────────────────────────────────────┤
│  说话人1   ► 0:00:08                                     │
│  "早上好，大家。让我们开始                               │
│   Q3预算审查。"                                          │
│                                                          │
│  说话人2   ► 0:00:21                                     │
│  "谢谢。我已经准备好了幻灯片。                           │
│   我们先从收入还是支出开始？"                            │
│                                                          │
│  说话人1   ► 0:00:30                                     │
│  "先看收入。Alice，能带我们过一遍吗？"                   │
└──────────────────────────────────────────────────────────┘

点击时间戳（每个片段旁边的► 0:00:08链接）会将音频/视频播放器跳转到该确切时刻。这使得快速验证引用或查找特定讨论无需手动拖动进度条。

说话人标签默认为"Speaker 1"、"Speaker 2"等。您可以重命名这些标签——参见第29章。

Summary（摘要）

Summary选项卡包含录音内容的简洁叙述。这不是转录词语的项目符号列表——而是捕捉主要讨论要点的综合概述。

示例（45分钟预算会议）：

团队审查了Q3收入表现，比预测高出8%。营销预算超支被确定为进入Q4时的主要关切。Alice提议将付费广告支出削减15%，该提议获得接受，待财务部门最终批准。小组同意在下周二重新开会审查修订后的预测。

摘要旨在可分享——您可以将其直接复制到电子邮件、项目管理工具或文档中，无需编辑。

Actions（行动项目）

Actions选项卡列出录音期间明确或隐含分配的任务。

┌──────────────────────────────────────────────────────────┐
│  行动项目                                                │
├──────────────────────────────────────────────────────────┤
│  □  将付费广告支出削减15%                                │
│     负责人：Alice  ·  截止：周二会议之前                 │
│     ► 0:32:14（录音中）                                  │
│                                                          │
│  □  将修订后的Q4预测发送给团队                           │
│     负责人：财务团队  ·  截止：周五                      │
│     ► 0:41:08（录音中）                                  │
│                                                          │
│  □  安排周二的跟进会议                                   │
│     负责人：（未指定）  ·  未提及截止日期                │
│     ► 0:43:55（录音中）                                  │
└──────────────────────────────────────────────────────────┘

每个行动项目包括：

任务 — 需要做什么
负责人 — 被要求执行的人（如有提及）
截止日期 — 何时需要（如有提及）
时间戳链接 — 跳转到录音中讨论此内容的位置

注意： AI从所说的内容中提取行动。如果讨论了某件事但没有明确分配，它可能会也可能不会出现在此处。请始终与录音或转录进行核对。

Decisions（决策）

Decisions选项卡列出录音期间达成的关键选择和协议。

┌──────────────────────────────────────────────────────────┐
│  决策                                                    │
├──────────────────────────────────────────────────────────┤
│  ✓  批准Q4付费广告支出削减15%                            │
│     ► 0:32:14                                            │
│                                                          │
│  ✓  Q3收入表现确认为最终结果（无需重新统计）             │
│     ► 0:12:45                                            │
│                                                          │
│  ✓  确认周二跟进会议                                     │
│     ► 0:43:55                                            │
└──────────────────────────────────────────────────────────┘

决策与行动不同：决策是达成了什么共识，而行动是某人因此必须做什么。

Chapters（章节）

Chapters选项卡将录音分解为按时间索引的话题片段，就像书中的章节或DVD上的章节。

┌──────────────────────────────────────────────────────────┐
│  章节                                                    │
├──────────────────────────────────────────────────────────┤
│  ► 0:00:00  开场介绍与日常事务              3分钟        │
│  ► 0:03:10  Q3收入回顾                     12分钟        │
│  ► 0:15:22  费用分析——市场营销             10分钟        │
│  ► 0:25:41  Q4预算提案                     18分钟        │
│  ► 0:43:30  总结与下一步                    4分钟        │
└──────────────────────────────────────────────────────────┘

点击任何章节会将播放器跳转到该话题的开始时间。如果您只想重新收听预算提案讨论，请点击► 0:25:41。

章节对于长录音特别有用，可帮助您快速找到特定话题。

AI建议的文件重命名

AI提取完成后，AI可能会根据会议内容为您的录音建议更具描述性的文件名。AI Insights面板顶部出现一个横幅：

┌──────────────────────────────────────────────────────────────┐
│  新文件名：Q3预算审查 — 10月15日团队会议                     │
│                                              [ Rename ]      │
└──────────────────────────────────────────────────────────────┘

应用建议的名称：

点击 Rename — 录音文件及其库条目立即重命名。
重命名后建议横幅消失。

保留原始名称：

忽略横幅 — 它不会自动应用，导航离开时会消失。

注意： 建议基于会议内容。对于通用或短录音，建议的名称可能与原始名称相似。您始终拥有最终决定权。

Gemini模型选择

SeaMeet动态地从Google的API获取可用的Gemini模型——随着Google发布新版本，模型列表保持最新。

使用哪个模型：

SeaMeet自动过滤支持文本、视觉和音频的模型（会议分析所需）
只显示有能力的最新模型——排除较旧或受限的模型
列表按最新/最有能力的模型排序

您可以在设置 → AI → 模型中查看和更改当前模型。默认为最有能力的可用模型。除非您需要降低成本或解决特定模型限制，否则很少有理由更改此设置。

截图 OCR — 自动提取文字并复制到剪贴板

AI提取不仅限于音频录音。当您在启用 "Extract text (OCR) and copy to clipboard" 选项的情况下截图时，SeaMeet 会自动对捕获的图像执行 OCR，并将提取的文字复制到您的剪贴板。

工作原理

**捕获前：**在 Capture Hub 或区域选择器覆盖层中勾选 "Extract text (OCR) and copy to clipboard" 复选框
截图（全屏或区域捕获）
等待约 15–30 秒 — AI 处理流程在后台处理图像
文字已复制到剪贴板 — 通知确认"已将提取的文字复制到剪贴板"
粘贴到任何位置 — Cmd+V / Ctrl+V 粘贴提取的文字

OCR 处理流程完全在后台运行。您可以在处理期间继续使用 SeaMeet 或切换到其他应用程序。提取完成后，剪贴板会自动更新。

设置位置

OCR 自动复制选项出现在三个位置：

位置	控制内容
Capture Hub（截图面板）	逐次切换 — 捕获模式选择器下方的复选框
区域选择器覆盖层	逐次切换 — 靠近"Capture Screen or Press Enter"的复选框
设置 → AI Extraction & Summary	默认开关 — "Auto-extract text (OCR) on screenshot"切换

三个位置保持同步。在任一位置切换都会更新其他位置。

要求

已配置 Gemini API 密钥（或具有受管密钥的有效订阅）
设置中已启用 AI 功能

如果没有可用的 API 密钥，复选框会显示为灰色并显示"（需要 API 密钥，请在此订阅）"，附有链接前往订阅入口。

提取的内容

OCR 处理流程会提取截图中所有可见文字——包括：

UI 标签、菜单和按钮
文档和网页内容
错误消息和对话框文字
代码和终端输出
手写文字（如果清晰可辨）

提取的文字也会保存在截图的 AI 提取面板中的 Text (OCR) 选项卡下，以便您稍后查看或重新复制。

重新生成

如果您对结果不满意，或者在重命名说话人后想要重新分析，可以重新生成。

点击⟳（重新生成）按钮，在选项卡栏中
- 您看到什么： 按钮旋转。简短的"Processing…"通知替换内容。
等待（与初次生成时间相同）
- 您看到什么： 所有五个选项卡以新结果刷新。
查看新结果

重要： 在覆盖您的结果之前，SeaMeet会自动将之前的提取存档为版本快照。任何内容都不会丢失。您可以随时浏览以前的版本——参见第29章B部分。

导出

选项卡栏包含导出按钮，让您将结果带到SeaMeet之外：

[Transcript] [Summary] [Actions] [Decisions] [Chapters]  ·  [MD] [SRT] [JSON] [⟳]

按钮	格式	最适合
MD	Markdown	笔记应用（Notion、Obsidian）、文档
SRT	SubRip字幕	为视频文件添加字幕（iMovie、Premiere、YouTube）
JSON	JSON数据	开发人员，导入其他工具

当前活动的选项卡决定导出内容：

在Summary选项卡上 → MD导出摘要文本
在Transcript选项卡上 → SRT以字幕形式导出带时间戳的转录
在Actions选项卡上 → MD或JSON导出行动项目列表

提示： 如果您想要当前结果的独立副本，请在重新生成前导出——虽然这并非严格必要，因为版本历史会自动保留过去的结果（参见第29章）。

故障排除

"提取失败"

症状： 加载动画停止，出现错误消息："Extraction failed"或"Something went wrong"。

按顺序尝试这些步骤：

检查您的互联网连接——尝试加载网页
验证您的API密钥是否仍有效（设置 → AI → 查找绿色对勾）
等待2–3分钟后重试——AI服务可能暂时过载
如果录音很长（2小时以上），请尝试分割或允许更多处理时间

"摘要似乎不完整"

症状： 摘要简短、遗漏关键话题或看起来很通用。

可能原因：

音频质量差 — 转录错误导致提取错误。在Transcript选项卡中检查是否有乱码片段。
录音捕获的声音太少 — 如果系统音频占主导（音乐、视频播放），AI处理的语音可能很少
录音非常短 — 不足2分钟的录音产生有限摘要

可以尝试：

重命名说话人并审查转录后，用⟳重新运行提取
改善未来录音的麦克风位置

"行动项目为空"

症状： 即使在明显有分配任务的会议后，Actions选项卡也是空的。

发生了什么： AI从明确的语言（"Can you…"、"I'll handle…"、"Let's make sure…"）中提取行动。隐含或非正式的承诺可能被遗漏。