即時轉錄——說話時文字即時顯示在螢幕上
第二十七章:即時轉錄——說話時文字即時顯示在螢幕上
想像一位法庭速記員在工作階段進行時同步打字——每個字在說出的瞬間即被擷取,無需等到會議結束後。這正是 SeaMeet 的即時轉錄為您的錄音所做的事。當您說話時,轉錄面板即時更新:發言者標籤、時間戳記和實際內容,全部在對話進行時同步出現。
無需等待。無需上傳步驟。只需文字即時顯示在螢幕上。
章節目標
閱讀本章後,您將能夠:
- 了解即時轉錄的功能及適用時機
- 在開始前完成必要的前置設定
- 啟動帶有即時轉錄的錄製工作階段
- 在錄製期間閱讀並解讀轉錄面板
- 了解自動發言者偵測的運作方式
- 排除最常見的連線和顯示問題
什麼是即時轉錄?
即時轉錄在您錄製的同時將錄音中的音訊轉換為文字,即時產生附有時間戳記和發言者標籤的轉錄記錄。
這樣想像: 想像每次會議都有一位速記員坐在您旁邊,即時寫下所有發言——標記每個人的話語並記錄確切的發言時間。轉錄記錄在會議結束的瞬間即可取得。沒有轉錄延遲。沒有「正在處理您的音訊」的等待畫面。
即時轉錄與您的錄製工作階段同步運作。您一開始錄製:
- AI 引擎即開始監聽
- 文字在說出後數秒內出現在轉錄面板中
- 發言者標籤(「Speaker 1」、「Speaker 2」)自動分配
- 時間戳記標記每個片段在錄製中的確切時間
您停止錄製後,完整的轉錄記錄會自動與音訊/影片檔案一起儲存。
開始前的準備
即時轉錄在首次使用前需要配置兩項內容:
1. 啟用 AI 功能
- 開啟設定(右上角的齒輪圖示 ⚙️)
- 導覽至 AI 類別
- 確認 AI Features 切換開關已開啟(藍色)
若切換開關呈灰色或 AI 類別不見了,請聯絡您的帳號管理員——AI 功能可能需要有效的訂閱。
2. 配置 API 金鑰
繼續在「設定 → AI」中:
- 找到 API Key 欄位
- 輸入您的 Gemini API 金鑰(請參閱第 31 章了解如何取得)
- 點擊 Save
綠色勾號表示金鑰有效。紅色警告表示金鑰不正確或已過期。
注意: 錄製期間需要有效的網際網路連線。即時轉錄無法在離線狀態下運作。
如何開始即時轉錄工作階段
開始即時轉錄與開始任何錄製的方式完全相同——無需啟用單獨的「轉錄模式」。只要 AI 功能已開啟且 API 金鑰已配置,即時轉錄就會自動啟動。
逐步說明:
-
點擊紅色錄製按鈕 🔴(或使用鍵盤快捷鍵:Windows 上的
Ctrl+Alt+A,macOS 上的Cmd+Shift+A)- 您看到的: 按鈕呈紅色脈衝。錄製計時器開始計數。
-
觀察轉錄面板出現
- 您看到的: 面板從主視窗右側滑入(或根據您的版面配置顯示在播放器下方)。短暫顯示「Connecting…」。
-
正常說話
- 您看到的: 2–5 秒後,文字開始出現。最新的短語在仍在處理時顯示微妙的動畫效果。
-
照常繼續您的會議或錄製
- 您看到的: 已完成的片段按時間順序堆疊,每個片段都附有發言者標籤和時間戳記。
-
完成後停止錄製
- 您看到的: 按鈕恢復到閒置狀態。短暫顯示「Saving transcript…」提示,然後消失。轉錄記錄已儲存。
錄製期間您看到的內容
轉錄面板有三個主要區域:
┌─────────────────────────────────────────────┐
│ Transcript 🟢 Connected │
├─────────────────────────────────────────────┤
│ Speaker 1 0:00:12 │
│ "Good morning everyone, let's get started" │
│ │
│ Speaker 2 0:00:24 │
│ "Thanks for joining on short notice" │
│ │
│ Speaker 1 0:00:31 │
│ "Of course. First item on the agenda…" │
├─────────────────────────────────────────────┤
│ Now Speaking… ████████░░░░ │
│ "…is the Q3 budget review" │
└─────────────────────────────────────────────┘
各元素的含義:
| 元素 | 含義 |
|---|---|
| 發言者標籤 | 誰在說話——自動分配(「Speaker 1」、「Speaker 2」) |
| 時間戳記 | 此片段在錄製中開始的時間(時:分:秒) |
| 已完成文字 | 最終確定的文字——不會再改變 |
| 「Now Speaking…」預覽 | 目前仍在處理的話語——可能略有變化 |
| 狀態指示器 | 🟢 已連線 · 🟡 連線中 · 🔴 錯誤 |
連線狀態指示器
面板右上角的指示器告訴您 AI 引擎是否可達:
- 🟢 已連線 — 轉錄正常運作
- 🟡 連線中 — 正在建立連線(啟動時正常,需 2–5 秒)
- 🔴 錯誤 — 連線中斷(請參閱下方的排除故障)
若您看到 🔴 錯誤,錄製本身仍安全繼續——只有即時轉錄受到影響。
自動發言者偵測
AI 引擎嘗試區分不同的聲音並為每個聲音分配標籤。
運作方式:
Recording timeline:
0:00 ──────────────────────────────────────────────────► time
│ │ │ │
Speaker 1 Speaker 2 Speaker 1 Speaker 2
"Morning" "Hello" "Agenda…" "Agreed"
▼ ▼ ▼ ▼
[Seg. 1] [Seg. 2] [Seg. 3] [Seg. 4]
每次發言者變換時,系統會建立一個新片段。來自同一發言者的片段獲得相同的標籤。
初始標籤: 第一個說話的人是「Speaker 1」,第二個新聲音是「Speaker 2」,以此類推。這些是佔位符——您可以在之後重新命名(請參閱第 29 章)。
發言者精修: 隨著錄製進行,若 AI 確信兩個片段屬於同一聲音,可能會修訂之前的分配。這是正常現象。文字不會改變——只有過去片段的發言者歸屬可能改變。
技巧: 為了獲得最準確的發言者分離效果,請使用耳機而非喇叭。麥克風拾取的喇叭輸出可能會混淆偵測器。
錄製停止後
當您點擊停止後:
- 「Now Speaking…」預覽完成任何進行中的句子
- 完整的轉錄記錄會自動與您的錄音檔案一起儲存
- 無需手動操作
在哪裡找到轉錄記錄:
- 在您的錄音庫中開啟該錄音
- 在詳細面板中點擊 AI Insights
- 選擇 Transcript 分頁
轉錄記錄也可從 AI Insights 分頁匯出為 SRT(字幕格式)或 JSON。詳見第 28 章的匯出說明。
限制
了解這些限制有助於設定合理的預期:
| 限制 | 詳情 |
|---|---|
| 需要網路 | 即時轉錄無法離線運作。音訊透過網路由 AI 引擎處理。 |
| 時間戳記精確度 | 時間戳記為近似值(±3 秒)。適合導覽使用,不適合法律文件。 |
| 錄製暫停 | 若您暫停錄製,轉錄也會暫停。暫停期間的片段不會被轉錄。 |
| 準確度因情況而異 | 語音清晰、一次只有一位發言者、麥克風品質良好時準確度最高。重口音、背景噪音或同時說話會降低準確度。 |
| 語 言 | 轉錄語言可設定為Auto Detect(建議)或在「設定 → AI → SeaMeet Integration」中指定特定語言。Auto Detect 可自動處理多語言會議。 |
| 無法即時編輯 | 錄製期間無法編輯轉錄記錄。錄製停止後才能進行編輯。 |
播放時的字幕疊加
播放具有即時轉錄的錄音時,SeaMeet 可以直接在影片上顯示字幕——就像電視上的隱藏字幕一樣。
字幕的運作方式:
- 字幕文字疊加在影片預覽框架底部
- 每個片段顯示發言者名稱(每位發言者有固定顏色)和說話內容
- 字幕與播放位置同步——隨著錄音播放而推進
- 字幕自動使用工作階段的 Gemini Live 轉錄記錄
發言者顏色: 每位發言者在所有字幕和轉錄面板中被分配一個固定顏色。顏色自動決定並在整個錄音中保持一致 。
字幕格式:
[Speaker 1]: Good morning everyone, let's get started.
字幕在對應的轉錄片段播放時出現並消失。
雙欄影片版面
觀看具有即時轉錄記錄的影片錄音時,SeaMeet 使用雙欄版面:
┌─────────────────────────────────────────────────────┐
│ Video Preview │ Transcript Panel │
│ │ │
│ [video with captions] │ Speaker 1 0:00:12 │
│ │ "Good morning..." │
│ │ │
│ │ Speaker 2 0:00:24 │
│ │ "Thanks for joining" │
│ │ [⤢ Max] │
└───────────────────────────── ────────────────────────┘
- 左欄: 固定寬度的影片,帶字幕疊加
- 右欄: 可捲動的轉錄面板,與播放位置同步
- 最大化按鈕(⤢): 將轉錄面板展開為全螢幕疊加,便於在長時間錄音中閱讀
雙欄版面僅適用於帶有即時轉錄的影片錄音。純音訊錄音和沒有轉錄記錄的錄音使用標準的單欄版面。
轉錄的語言設定
您可以配置 SeaMeet 在即時轉錄期間預期使用的語言:
- 開啟設定(⚙️)
- 導覽至 AI → SeaMeet Integration
- 找到 Meeting Language 選擇器
- 選擇您的語言:
- Auto Detect(預設,建議)— SeaMeet 自動識別所說的語言。最適合多語言會議或語言不固定的情況。
- 手動選擇 — 從 20 多種特定語言中選擇,包括英語(美式/英式)、西班牙語、法語、德語、日語、普通話、粵語、韓語等。
技巧: 除非您有特定理由強制指定語言,否則請將語言設定保持為 Auto Detect。自動偵測對口音和混合語言會議的處理效果優於手動強制設定。
排除故障
「轉錄面板未出現」
症狀: 您開始錄製,但轉錄面板始終不顯示。
按順序確認以下項目:
- 前往「設定 → AI」,確認 AI Features 切換開關已開啟
- 確認您的 API 金鑰有效(「設定 → AI」中有綠色勾號)
- 確認您的網際網路連線——嘗試載入網頁
- 重新啟動 SeaMeet 後再試
若完成所有四個步驟後面板仍未出現,AI 服務可能暫時不可用。錄製本身不受影響——請稍後再試。
「錄製途中連線中斷」
症狀: 錄製中狀態指示器變為 🔴 紅色。
發生了什麼: 與 AI 引擎的連線中斷。可能的原因:
- 暫時性的網路中斷
- Wi-Fi 切換存取點
- AI 服務短暫離線
該怎麼做:
- 不要停止錄製——它仍安全繼續
- 確認您的網際網路連線
- 連線通常在 30 秒內自動恢復
- 中斷期間說出的文字無法復原——它們在即時轉錄中遺失(但音訊仍保存在錄音檔案中,您可以在事後執行 AI 摘要——請參閱第 28 章)
「發言者標籤不正確」
症狀: 多人被標記為「Speaker 1」,或一個人顯示為兩個不同的發言者。
發生了什麼: 發言者偵測使用聲音特徵。以下情況會降低準確度:
- 多人同時說話
- 發言者的聲音變化明顯(笑聲、提高聲音、音訊品質差)
- 背景噪音干擾
該怎麼做:
- 錄製結束後,在「發言者」面板中重新命名發言者(請參閱第 29 章)
- 使用合併功能將同屬一人的兩個標籤合併(第 29 章)
最佳實踐
遵循以下做法可獲得最佳的即時轉錄效果:
一次一位發言者 同時說話(兩人同時發言)會混淆發言者偵測,在轉錄記錄中產生混亂的文字。請鼓勵參與者輪流發言。
安靜的錄製環境 背景噪音——空調系統、打字聲、街道噪音——會被麥克風拾取,降低轉錄準確度。靠近嘴部的耳機麥克風效果遠優於筆記型電腦內建麥克風。
良好的麥克風位置 對於多位參與者的面對面會議,將麥克風放置在桌子中央,或為每位參與者使用獨立麥克風。
穩定的網際網路連線 使用有線連線或強力的 Wi-Fi 訊號。避免使用行動熱點或高封包遺失的網路——它們會導致連線中斷。
及時重新命名發言者 在記憶猶新時立即完成發言者重新命名。請參閱第 29 章的說明。
快速參考
┌────────────────────────────────────────────────────────────┐
│ LIVE TRANSCRIPTION │
│ Quick Reference │
├────────────────────────────────────────────────────────────┤
│ Start │ Record normally — auto-activates │
│ Status: green │ 🟢 Transcription running │
│ Status: yellow │ 🟡 Connecting (wait 5 s) │
│ Status: red │ 🔴 Disconnected — recording safe │
├────────────────────────────────────────────────────────────┤
│ Transcript panel │ Right side of main window │
│ Preview line │ "Now Speaking…" — in progress │
│ Completed lines │ Final — won't change │
├────────────────────────────────────────────────────────────┤
│ After stopping │ Transcript saved automatically │
│ Find it │ Recording → AI Insights → Transcript │
├────────────────────────────────────────────────────────────┤
│ Requires │ Internet + AI Features on + API key │
│ Timestamps │ Approximate ±3 seconds │
│ Pauses │ Not transcribed │
└────────────────────────────────────────────────────────────┘
Last updated: 2026-03-20
Published: