SeaMeet Desktop 来了 — 录制一切,不错过任何内容。免费下载 →

实时转录——边说边显示文字

第 27 章:实时转录——边说边显示文字

想象一位法庭记录员在会议进行时打字——每个字在说出的那一刻就被捕获,无需等到会议结束。这正是 SeaMeet 的实时转录为你的录音所做的事情。当你说话时,转录面板实时填充:说话人标签、时间戳以及实际说出的文字,所有内容在对话发生时同步出现。

无需等待。无需上传步骤。文字直接出现在屏幕上。


本章目标

阅读本章后,你将能够:

  • 了解实时转录的作用以及何时使用它
  • 在开始之前设置好前提条件
  • 启动带有实时转录的录制会话
  • 在录制时阅读和解读转录面板
  • 了解自动说话人检测的工作原理
  • 排除最常见的连接和显示问题

什么是实时转录?

实时转录在你录制的同时将录音中的音频转换为文字,实时生成带有时间戳和说话人标签的转录稿。

这样理解: 想象在每次会议中,旁边坐着一位打字员,立即将所有说过的内容写下来——为每个人的话打上标签,并标注他们说话的确切时间。会议结束的那一刻,这份转录稿就已备好。没有转录延迟。没有"正在处理你的音频"的等待界面。

实时转录与你的录制会话同步运行。一旦你开始录制:

  • AI 引擎开始监听
  • 在语音说出后几秒钟内,文字就出现在转录面板中
  • 自动分配说话人标签("说话人 1"、"说话人 2")
  • 时间戳标记每个片段在录音中的位置

停止录制后,完整的转录稿会自动与音频/视频文件一起保存。


开始之前

实时转录在首次使用前需要配置两项内容:

1. 启用 AI 功能

  1. 打开设置(右上角的齿轮图标 ⚙️)
  2. 导航至 AI 类别
  3. 确认 AI 功能开关处于开启状态(蓝色)

如果开关是灰色的或 AI 类别不存在,请联系你的账户管理员——AI 功能可能需要有效订阅。

2. 配置 API 密钥

仍在设置 → AI 中:

  1. 查找 API 密钥字段
  2. 输入你的 Gemini API 密钥(如何获取请参阅第 31 章)
  3. 点击保存

绿色复选标记确认密钥有效。红色警告表示密钥不正确或已过期。

注意: 录制过程中需要有效的互联网连接。实时转录无法离线运行。


如何开始实时转录会话

开始实时转录与开始任何录制完全相同——不需要启用单独的"转录模式"。如果 AI 功能已开启且 API 密钥已配置,实时转录会自动激活。

分步说明:

  1. 点击红色录制按钮 🔴(或使用键盘快捷键:Windows 为 Ctrl+Alt+A,macOS 为 Cmd+Shift+A

    • 你看到的: 按钮脉冲红色。录制计时器开始计数。
  2. 观察转录面板出现

    • 你看到的: 一个面板滑入主窗口右侧(或播放器下方,取决于你的布局)。短暂显示"连接中……"。
  3. 正常说话

    • 你看到的: 2–5 秒后,文字开始出现。仍在处理中的最新短语会显示一个微妙的动画。
  4. 正常进行你的会议或录制

    • 你看到的: 完成的片段按时间顺序叠加,每个都附有说话人标签和时间戳。
  5. 完成后停止录制

    • 你看到的: 按钮返回空闲状态。短暂显示"正在保存转录……"通知,然后消失。转录稿已存储。

录制时你看到的内容

转录面板有三个主要区域:

┌─────────────────────────────────────────────┐
│  转录稿                         🟢 已连接   │
├─────────────────────────────────────────────┤
│  说话人 1   0:00:12                         │
│  "早上好各位,让我们开始吧"                 │
│                                             │
│  说话人 2   0:00:24                         │
│  "感谢大家临时参加"                         │
│                                             │
│  说话人 1   0:00:31                         │
│  "当然。议程第一项……"                       │
├─────────────────────────────────────────────┤
│  正在说话……  ████████░░░░                   │
│  "……是 Q3 预算审查"                         │
└─────────────────────────────────────────────┘

每个元素的含义:

元素含义
说话人标签说话的人——自动分配("说话人 1"、"说话人 2")
时间戳此片段在录音中开始的时间(小时:分钟:秒)
已完成的文字已定稿的文字——不会更改
"正在说话……"预览当前仍在处理的语句——可能会稍有变化
状态指示器🟢 已连接 · 🟡 连接中 · 🔴 错误

连接状态指示器

面板右上角的指示器告诉你 AI 引擎是否可访问:

  • 🟢 已连接 — 转录正常运行
  • 🟡 连接中 — 正在建立连接(启动时正常,需 2–5 秒)
  • 🔴 错误 — 连接中断(见下方故障排除)

如果看到 🔴 错误,录制本身会安全继续——只有实时转录受到影响。


自动说话人检测

AI 引擎会尝试区分不同的声音并为每个声音分配标签。

工作原理:

录制时间轴:

0:00 ──────────────────────────────────────────────────► 时间
        │           │           │           │
     说话人 1    说话人 2    说话人 1    说话人 2
     "早上好"    "你好"     "议程……"    "同意"
         ▼           ▼           ▼           ▼
      [片段 1]    [片段 2]    [片段 3]    [片段 4]

每次说话人变换,系统都会创建一个新片段。同一说话人的片段会获得相同的标签。

初始标签: 第一个说话的人是"说话人 1",第二个新声音是"说话人 2",以此类推。这些是占位符——你可以稍后重命名它们(参见第 29 章)。

说话人细化: 随着录制进行,如果 AI 确信两个片段属于同一声音,它可能会细化早期的分配。这是正常的。文字不会更改——只有早期片段上的说话人归属可能改变。

提示: 为了最准确的说话人分离,请使用耳机而不是扬声器。扬声器被麦克风拾取的声音会混淆检测器。


录制停止后

当你点击停止时:

  1. "正在说话……"预览对正在进行的句子进行最终确认
  2. 完整的转录稿自动与你的录音文件一起保存
  3. 无需任何手动操作

在哪里找到转录稿:

  • 在你的录音库中打开录音
  • 点击详情面板中的 AI 洞察
  • 选择转录选项卡

转录稿也可以从 AI 洞察选项卡导出为 SRT(字幕格式)或 JSON。导出详情参见第 28 章。


局限性

了解这些局限性有助于建立现实的期望:

局限性详情
需要互联网实时转录无法离线运行。音频通过网络由 AI 引擎处理。
时间戳准确性时间戳是近似值(±3 秒)。用于导航,不用于法律文件。
录制暂停如果你暂停录制,转录也会暂停。暂停的片段不会被转录。
准确性因情况而异语音清晰、一次只有一人说话且麦克风质量好时准确性最高。严重口音、背景噪音或交叉谈话会降低准确性。
语言转录语言可以设置为自动检测(推荐)或在设置 → AI → SeaMeet 集成中指定特定语言。自动检测会自动处理多语言会议。
不支持实时编辑录制时无法编辑转录稿。录制停止后可以进行编辑。

播放时的字幕叠加

当你播放有实时转录的录音时,SeaMeet 可以将字幕直接显示在视频上——就像电视上的隐藏字幕。

字幕的工作方式:

  • 字幕文字叠加在视频预览的底部
  • 每个片段显示说话人名称(每位说话人有不同颜色)和说出的文字
  • 字幕与播放位置同步——随着录音播放而推进
  • 字幕自动使用该会话的 Gemini Live 转录

说话人颜色: 每位说话人在所有字幕和转录面板中都被分配一个一致的颜色。颜色由系统自动确定,并在整个录音中保持一致。

字幕格式:

[说话人 1]: 早上好各位,让我们开始吧。

字幕随匹配的转录片段播放而出现和消失。


双栏视频布局

观看带有实时转录的视频录音时,SeaMeet 使用双栏布局:

┌─────────────────────────────────────────────────────┐
│  视频预览                  │  转录面板               │
│                            │                         │
│  [带字幕的视频]            │  说话人 1   0:00:12    │
│                            │  "早上好……"             │
│                            │                         │
│                            │  说话人 2   0:00:24    │
│                            │  "感谢参加"             │
│                            │              [⤢ 最大化] │
└─────────────────────────────────────────────────────┘
  • 左栏: 固定宽度的带字幕叠加视频
  • 右栏: 与播放位置同步的滚动转录面板
  • 最大化按钮(⤢): 将转录面板扩展到全屏叠加,便于在长时间录音时阅读

双栏布局只出现在带有实时转录的视频录音中。纯音频录音和没有转录的录音使用标准单栏布局。


转录的语言设置

你可以配置 SeaMeet 在实时转录期间期望的语言:

  1. 打开设置(⚙️)
  2. 导航至 AISeaMeet 集成
  3. 找到会议语言选择器
  4. 选择你的语言:
    • 自动检测(默认,推荐)— SeaMeet 自动识别口语语言。最适合多语言会议或语言变化的情况。
    • 手动选择 — 从 20 多种特定语言中选择,包括英语(美国/英国)、西班牙语、法语、德语、日语、普通话、粤语、韩语等。

提示: 除非你有特定原因要强制指定语言,否则请将语言设置为自动检测。自动检测比手动强制设置更能处理口音和混合语言的会议。


故障排除

"转录面板未出现"

症状: 你开始录制但转录面板从未显示。

按顺序检查以下内容:

  1. 前往设置 → AI,确认 AI 功能开关处于开启状态
  2. 确认你的 API 密钥有效(设置 → AI 中的绿色复选标记)
  3. 检查你的互联网连接——尝试加载一个网页
  4. 重启 SeaMeet 并再试

如果经过所有四个步骤后面板仍未出现,AI 服务可能暂时不可用。录制本身不受影响——稍后再试。


"录制中途连接中断"

症状: 录制期间状态指示器变为 🔴 红色。

发生了什么: 与 AI 引擎的连接被中断。这可能由以下原因引起:

  • 临时网络中断
  • Wi-Fi 切换接入点
  • AI 服务短暂离线

该怎么办:

  1. 不要停止录制——它会安全继续
  2. 检查你的互联网连接
  3. 连接通常会在 30 秒内自动恢复
  4. 断线期间说出的内容无法恢复——这些内容在实时转录中丢失(但音频仍保留在录音文件中,因此你可以事后运行 AI 摘要——参见第 28 章)

"说话人标签不正确"

症状: 多人被标记为"说话人 1",或一个人出现为两个不同的说话人。

发生了什么: 说话人检测使用声音特征。在以下情况下准确性会降低:

  • 多人同时说话
  • 说话人的声音发生显著变化(笑声、提高声音、音频质量差)
  • 背景噪音干扰

该怎么办:

  • 录制结束后,在说话人面板中重命名说话人(参见第 29 章)
  • 使用合并功能将属于同一人的两个标签合并(第 29 章)

最佳实践

遵循这些实践以获得最佳实时转录效果:

一次只有一人说话 交叉谈话(两人同时说话)会混淆说话人检测,并在转录稿中产生混乱的文字。鼓励参与者轮流发言。

安静的录制环境 背景噪音——暖通空调系统、打字声、街道噪音——会被麦克风拾取并降低转录准确性。靠近嘴巴放置的耳机麦克风比内置笔记本电脑麦克风效果好得多。

良好的麦克风位置 对于有多名参与者的现场会议,将麦克风放在桌子中央,或为每位参与者使用独立的麦克风。

稳定的互联网连接 使用有线连接或强 Wi-Fi 信号。避免热点或高丢包网络——它们会导致连接中断。

及时重命名说话人 在录制结束后立即进行说话人重命名,那时你还记得谁说了什么。操作说明参见第 29 章。


快速参考

┌────────────────────────────────────────────────────────────┐
│                    实时转录                                │
│                    快速参考                                │
├────────────────────────────────────────────────────────────┤
│  开始             │ 正常录制——自动激活                    │
│  状态:绿色       │ 🟢 转录正在运行                       │
│  状态:黄色       │ 🟡 连接中(等待 5 秒)                │
│  状态:红色       │ 🔴 已断开——录制安全                   │
├────────────────────────────────────────────────────────────┤
│  转录面板         │ 主窗口右侧                             │
│  预览行           │ "正在说话……"——进行中                  │
│  已完成行         │ 已定稿——不会更改                      │
├────────────────────────────────────────────────────────────┤
│  停止后           │ 转录稿自动保存                        │
│  找到它           │ 录音 → AI 洞察 → 转录                │
├────────────────────────────────────────────────────────────┤
│  需要             │ 互联网 + AI 功能开启 + API 密钥       │
│  时间戳           │ 近似值 ±3 秒                          │
│  暂停             │ 不会被转录                            │
└────────────────────────────────────────────────────────────┘

Last updated: 2026-03-20

第 26 章:术语词汇表 | 第 28 章:AI 摘要 →

Published: