SeaMeet Desktop 來了 — 錄製一切,不錯過任何內容。免費下載 →

即時轉錄——說話時文字即時顯示在螢幕上

第二十七章:即時轉錄——說話時文字即時顯示在螢幕上

想像一位法庭速記員在工作階段進行時同步打字——每個字在說出的瞬間即被擷取,無需等到會議結束後。這正是 SeaMeet 的即時轉錄為您的錄音所做的事。當您說話時,轉錄面板即時更新:發言者標籤、時間戳記和實際內容,全部在對話進行時同步出現。

無需等待。無需上傳步驟。只需文字即時顯示在螢幕上。


章節目標

閱讀本章後,您將能夠:

  • 了解即時轉錄的功能及適用時機
  • 在開始前完成必要的前置設定
  • 啟動帶有即時轉錄的錄製工作階段
  • 在錄製期間閱讀並解讀轉錄面板
  • 了解自動發言者偵測的運作方式
  • 排除最常見的連線和顯示問題

什麼是即時轉錄?

即時轉錄在您錄製的同時將錄音中的音訊轉換為文字,即時產生附有時間戳記和發言者標籤的轉錄記錄。

這樣想像: 想像每次會議都有一位速記員坐在您旁邊,即時寫下所有發言——標記每個人的話語並記錄確切的發言時間。轉錄記錄在會議結束的瞬間即可取得。沒有轉錄延遲。沒有「正在處理您的音訊」的等待畫面。

即時轉錄與您的錄製工作階段同步運作。您一開始錄製:

  • AI 引擎即開始監聽
  • 文字在說出後數秒內出現在轉錄面板中
  • 發言者標籤(「Speaker 1」、「Speaker 2」)自動分配
  • 時間戳記標記每個片段在錄製中的確切時間

您停止錄製後,完整的轉錄記錄會自動與音訊/影片檔案一起儲存。


開始前的準備

即時轉錄在首次使用前需要配置兩項內容:

1. 啟用 AI 功能

  1. 開啟設定(右上角的齒輪圖示 ⚙️)
  2. 導覽至 AI 類別
  3. 確認 AI Features 切換開關已開啟(藍色)

若切換開關呈灰色或 AI 類別不見了,請聯絡您的帳號管理員——AI 功能可能需要有效的訂閱。

2. 配置 API 金鑰

繼續在「設定 → AI」中:

  1. 找到 API Key 欄位
  2. 輸入您的 Gemini API 金鑰(請參閱第 31 章了解如何取得)
  3. 點擊 Save

綠色勾號表示金鑰有效。紅色警告表示金鑰不正確或已過期。

注意: 錄製期間需要有效的網際網路連線。即時轉錄無法在離線狀態下運作。


如何開始即時轉錄工作階段

開始即時轉錄與開始任何錄製的方式完全相同——無需啟用單獨的「轉錄模式」。只要 AI 功能已開啟且 API 金鑰已配置,即時轉錄就會自動啟動。

逐步說明:

  1. 點擊紅色錄製按鈕 🔴(或使用鍵盤快捷鍵:Windows 上的 Ctrl+Alt+A,macOS 上的 Cmd+Shift+A

    • 您看到的: 按鈕呈紅色脈衝。錄製計時器開始計數。
  2. 觀察轉錄面板出現

    • 您看到的: 面板從主視窗右側滑入(或根據您的版面配置顯示在播放器下方)。短暫顯示「Connecting…」。
  3. 正常說話

    • 您看到的: 2–5 秒後,文字開始出現。最新的短語在仍在處理時顯示微妙的動畫效果。
  4. 照常繼續您的會議或錄製

    • 您看到的: 已完成的片段按時間順序堆疊,每個片段都附有發言者標籤和時間戳記。
  5. 完成後停止錄製

    • 您看到的: 按鈕恢復到閒置狀態。短暫顯示「Saving transcript…」提示,然後消失。轉錄記錄已儲存。

錄製期間您看到的內容

轉錄面板有三個主要區域:

┌─────────────────────────────────────────────┐
│  Transcript                    🟢 Connected  │
├─────────────────────────────────────────────┤
│  Speaker 1   0:00:12                        │
│  "Good morning everyone, let's get started" │
│                                             │
│  Speaker 2   0:00:24                        │
│  "Thanks for joining on short notice"       │
│                                             │
│  Speaker 1   0:00:31                        │
│  "Of course. First item on the agenda…"    │
├─────────────────────────────────────────────┤
│  Now Speaking…  ████████░░░░                │
│  "…is the Q3 budget review"                 │
└─────────────────────────────────────────────┘

各元素的含義:

元素含義
發言者標籤誰在說話——自動分配(「Speaker 1」、「Speaker 2」)
時間戳記此片段在錄製中開始的時間(時:分:秒)
已完成文字最終確定的文字——不會再改變
「Now Speaking…」預覽目前仍在處理的話語——可能略有變化
狀態指示器🟢 已連線 · 🟡 連線中 · 🔴 錯誤

連線狀態指示器

面板右上角的指示器告訴您 AI 引擎是否可達:

  • 🟢 已連線 — 轉錄正常運作
  • 🟡 連線中 — 正在建立連線(啟動時正常,需 2–5 秒)
  • 🔴 錯誤 — 連線中斷(請參閱下方的排除故障)

若您看到 🔴 錯誤,錄製本身仍安全繼續——只有即時轉錄受到影響。


自動發言者偵測

AI 引擎嘗試區分不同的聲音並為每個聲音分配標籤。

運作方式:

Recording timeline:

0:00 ──────────────────────────────────────────────────► time
        │           │           │           │
      Speaker 1   Speaker 2   Speaker 1   Speaker 2
      "Morning"   "Hello"     "Agenda…"   "Agreed"
          ▼           ▼           ▼           ▼
      [Seg. 1]    [Seg. 2]    [Seg. 3]    [Seg. 4]

每次發言者變換時,系統會建立一個新片段。來自同一發言者的片段獲得相同的標籤。

初始標籤: 第一個說話的人是「Speaker 1」,第二個新聲音是「Speaker 2」,以此類推。這些是佔位符——您可以在之後重新命名(請參閱第 29 章)。

發言者精修: 隨著錄製進行,若 AI 確信兩個片段屬於同一聲音,可能會修訂之前的分配。這是正常現象。文字不會改變——只有過去片段的發言者歸屬可能改變。

技巧: 為了獲得最準確的發言者分離效果,請使用耳機而非喇叭。麥克風拾取的喇叭輸出可能會混淆偵測器。


錄製停止後

當您點擊停止後:

  1. 「Now Speaking…」預覽完成任何進行中的句子
  2. 完整的轉錄記錄會自動與您的錄音檔案一起儲存
  3. 無需手動操作

在哪裡找到轉錄記錄:

  • 在您的錄音庫中開啟該錄音
  • 在詳細面板中點擊 AI Insights
  • 選擇 Transcript 分頁

轉錄記錄也可從 AI Insights 分頁匯出為 SRT(字幕格式)或 JSON。詳見第 28 章的匯出說明。


限制

了解這些限制有助於設定合理的預期:

限制詳情
需要網路即時轉錄無法離線運作。音訊透過網路由 AI 引擎處理。
時間戳記精確度時間戳記為近似值(±3 秒)。適合導覽使用,不適合法律文件。
錄製暫停若您暫停錄製,轉錄也會暫停。暫停期間的片段不會被轉錄。
準確度因情況而異語音清晰、一次只有一位發言者、麥克風品質良好時準確度最高。重口音、背景噪音或同時說話會降低準確度。
語言轉錄語言可設定為Auto Detect(建議)或在「設定 → AI → SeaMeet Integration」中指定特定語言。Auto Detect 可自動處理多語言會議。
無法即時編輯錄製期間無法編輯轉錄記錄。錄製停止後才能進行編輯。

播放時的字幕疊加

播放具有即時轉錄的錄音時,SeaMeet 可以直接在影片上顯示字幕——就像電視上的隱藏字幕一樣。

字幕的運作方式:

  • 字幕文字疊加在影片預覽框架底部
  • 每個片段顯示發言者名稱(每位發言者有固定顏色)和說話內容
  • 字幕與播放位置同步——隨著錄音播放而推進
  • 字幕自動使用工作階段的 Gemini Live 轉錄記錄

發言者顏色: 每位發言者在所有字幕和轉錄面板中被分配一個固定顏色。顏色自動決定並在整個錄音中保持一致。

字幕格式:

[Speaker 1]: Good morning everyone, let's get started.

字幕在對應的轉錄片段播放時出現並消失。


雙欄影片版面

觀看具有即時轉錄記錄的影片錄音時,SeaMeet 使用雙欄版面:

┌─────────────────────────────────────────────────────┐
│  Video Preview             │  Transcript Panel       │
│                            │                         │
│  [video with captions]     │  Speaker 1   0:00:12   │
│                            │  "Good morning..."     │
│                            │                         │
│                            │  Speaker 2   0:00:24   │
│                            │  "Thanks for joining"  │
│                            │              [⤢ Max]   │
└─────────────────────────────────────────────────────┘
  • 左欄: 固定寬度的影片,帶字幕疊加
  • 右欄: 可捲動的轉錄面板,與播放位置同步
  • 最大化按鈕(⤢): 將轉錄面板展開為全螢幕疊加,便於在長時間錄音中閱讀

雙欄版面僅適用於帶有即時轉錄的影片錄音。純音訊錄音和沒有轉錄記錄的錄音使用標準的單欄版面。


轉錄的語言設定

您可以配置 SeaMeet 在即時轉錄期間預期使用的語言:

  1. 開啟設定(⚙️)
  2. 導覽至 AISeaMeet Integration
  3. 找到 Meeting Language 選擇器
  4. 選擇您的語言:
    • Auto Detect(預設,建議)— SeaMeet 自動識別所說的語言。最適合多語言會議或語言不固定的情況。
    • 手動選擇 — 從 20 多種特定語言中選擇,包括英語(美式/英式)、西班牙語、法語、德語、日語、普通話、粵語、韓語等。

技巧: 除非您有特定理由強制指定語言,否則請將語言設定保持為 Auto Detect。自動偵測對口音和混合語言會議的處理效果優於手動強制設定。


排除故障

「轉錄面板未出現」

症狀: 您開始錄製,但轉錄面板始終不顯示。

按順序確認以下項目:

  1. 前往「設定 → AI」,確認 AI Features 切換開關已開啟
  2. 確認您的 API 金鑰有效(「設定 → AI」中有綠色勾號)
  3. 確認您的網際網路連線——嘗試載入網頁
  4. 重新啟動 SeaMeet 後再試

若完成所有四個步驟後面板仍未出現,AI 服務可能暫時不可用。錄製本身不受影響——請稍後再試。


「錄製途中連線中斷」

症狀: 錄製中狀態指示器變為 🔴 紅色。

發生了什麼: 與 AI 引擎的連線中斷。可能的原因:

  • 暫時性的網路中斷
  • Wi-Fi 切換存取點
  • AI 服務短暫離線

該怎麼做:

  1. 不要停止錄製——它仍安全繼續
  2. 確認您的網際網路連線
  3. 連線通常在 30 秒內自動恢復
  4. 中斷期間說出的文字無法復原——它們在即時轉錄中遺失(但音訊仍保存在錄音檔案中,您可以在事後執行 AI 摘要——請參閱第 28 章)

「發言者標籤不正確」

症狀: 多人被標記為「Speaker 1」,或一個人顯示為兩個不同的發言者。

發生了什麼: 發言者偵測使用聲音特徵。以下情況會降低準確度:

  • 多人同時說話
  • 發言者的聲音變化明顯(笑聲、提高聲音、音訊品質差)
  • 背景噪音干擾

該怎麼做:

  • 錄製結束後,在「發言者」面板中重新命名發言者(請參閱第 29 章)
  • 使用合併功能將同屬一人的兩個標籤合併(第 29 章)

最佳實踐

遵循以下做法可獲得最佳的即時轉錄效果:

一次一位發言者 同時說話(兩人同時發言)會混淆發言者偵測,在轉錄記錄中產生混亂的文字。請鼓勵參與者輪流發言。

安靜的錄製環境 背景噪音——空調系統、打字聲、街道噪音——會被麥克風拾取,降低轉錄準確度。靠近嘴部的耳機麥克風效果遠優於筆記型電腦內建麥克風。

良好的麥克風位置 對於多位參與者的面對面會議,將麥克風放置在桌子中央,或為每位參與者使用獨立麥克風。

穩定的網際網路連線 使用有線連線或強力的 Wi-Fi 訊號。避免使用行動熱點或高封包遺失的網路——它們會導致連線中斷。

及時重新命名發言者 在記憶猶新時立即完成發言者重新命名。請參閱第 29 章的說明。


快速參考

┌────────────────────────────────────────────────────────────┐
│                  LIVE TRANSCRIPTION                        │
│                   Quick Reference                          │
├────────────────────────────────────────────────────────────┤
│  Start             │ Record normally — auto-activates      │
│  Status: green     │ 🟢 Transcription running              │
│  Status: yellow    │ 🟡 Connecting (wait 5 s)              │
│  Status: red       │ 🔴 Disconnected — recording safe      │
├────────────────────────────────────────────────────────────┤
│  Transcript panel  │ Right side of main window             │
│  Preview line      │ "Now Speaking…" — in progress         │
│  Completed lines   │ Final — won't change                  │
├────────────────────────────────────────────────────────────┤
│  After stopping    │ Transcript saved automatically        │
│  Find it           │ Recording → AI Insights → Transcript  │
├────────────────────────────────────────────────────────────┤
│  Requires          │ Internet + AI Features on + API key   │
│  Timestamps        │ Approximate ±3 seconds                │
│  Pauses            │ Not transcribed                       │
└────────────────────────────────────────────────────────────┘

Last updated: 2026-03-20

第二十六章:術語表 | 第二十八章:AI 摘要 →

Published: