Kabanata 27: Live na Transkripsiyon — Mga Salita sa Screen Habang Nagsasalita Ka

Isipin ang isang court reporter na nagta-type habang nagaganap ang session—bawat salita ay nakuha sa sandaling ito ay sinabi, nang hindi kailangang hintayin ang matapos ang pulong. Iyon mismo ang ginagawa ng live na transkripsiyon ng SeaMeet para sa iyong mga rekording. Habang nagsasalita ka, ang transcript panel ay napupuno sa real time: mga label ng speaker, timestamp, at mga aktwal na salita, lahat ay lumalabas habang nagaganap ang pag-uusap.

Walang paghihintay. Walang hakbang ng pag-upload. Mga salita lang sa screen.

Mga Layunin ng Kabanata

Pagkatapos basahin ang kabanatang ito, magagawa mong:

Maunawaan kung ano ang ginagawa ng live na transkripsiyon at kung kailan ito gagamitin
I-set up ang mga kinakailangan bago magsimula
Magsimula ng recording session na may aktibong live na transkripsiyon
Basahin at bigyang-kahulugan ang transcript panel habang nagre-rekord
Maunawaan kung paano gumagana ang awtomatikong pagtuklas ng speaker
I-troubleshoot ang mga pinaka-karaniwang isyu sa koneksyon at display

Ano ang Live na Transkripsiyon?

Kino-convert ng live na transkripsiyon ang audio mula sa iyong rekording sa teksto habang nagre-rekord ka, gumagawa ng timestamped, speaker-labelled na transcript sa real time.

Isipin ito ganito: Isipin ang isang typist na nakaupo sa tabi mo sa bawat pulong, agad na isinusulat ang lahat ng sinabi—nila-label ang mga salita ng bawat tao at tinutukoy ang eksaktong oras na nagsalita sila. Ang transcript na iyon ay available sa sandaling matapos ang pulong. Walang pagkaantala ng transkripsiyon. Walang "nagpoproseso ng iyong audio" na spinner.

Tumatakbo ang live na transkripsiyon kasabay ng iyong recording session. Sa sandaling magsimula kang mag-rekord:

Nagsisimulang makinig ang isang AI engine
Lumalabas ang mga salita sa Transcript panel sa loob ng ilang segundo ng pagsasalita
Awtomatikong itinalaga ang mga label ng speaker ("Speaker 1", "Speaker 2")
Tinutukoy ng mga timestamp kung saan sa rekording napapabilang ang bawat segment

Kapag huminto ka sa pagre-rekord, ang kumpletong transcript ay awtomatikong nini-save kasabay ng audio/video file.

Bago Ka Magsimula

Nangangailangan ang live na transkripsiyon ng dalawang bagay na ma-configure bago ang iyong unang session:

1. Naka-enable ang Mga Tampok ng AI

Buksan ang Mga Setting (gear icon ⚙️ sa itaas-kanang sulok)
Mag-navigate sa kategorya ng AI
Kumpirmahin na ang toggle ng Mga Tampok ng AI ay on (asul)

Kung gray ang toggle o nawawala ang kategorya ng AI, makipag-ugnayan sa iyong account administrator—ang mga tampok ng AI ay maaaring mangailangan ng aktibong subscription.

2. Na-configure ang API Key

Nandito pa rin sa Mga Setting → AI:

Hanapin ang field ng API Key
Ilagay ang iyong Gemini API key (tingnan ang Kabanata 31 kung paano makakuha ng isa)
I-click ang I-save

Ang isang berdeng checkmark ay nagkukumpirma na valid ang key. Ang isang pulang babala ay nangangahulugang mali o nag-expire na ang key.

Tala: Kailangan mo ng aktibong koneksyon sa internet sa panahon ng pagre-rekord. Hindi maaaring tumakbo ang live na transkripsiyon nang offline.

Paano Magsimula ng Live Transcription Session

Ang pagsisimula ng live na transkripsiyon ay kapareho ng pagsisimula ng anumang pagre-rekord—walang hiwalay na "transcription mode" na kailangang i-enable. Kung naka-on ang Mga Tampok ng AI at na-configure ang API key, awtomatikong naa-activate ang live na transkripsiyon.

Hakbang-hakbang:

I-click ang pulang record button 🔴 (o gamitin ang iyong keyboard shortcut: Ctrl+Alt+A sa Windows, Cmd+Shift+A sa macOS)
- Ano ang makikita mo: Nagpu-pulse nang pula ang button. Nagsisimulang bilangin pataas ang recording timer.
Panoorin ang Transcript panel na lumabas
- Ano ang makikita mo: Isang panel ay humihiwa sa view sa kanang bahagi ng pangunahing window (o sa ibaba ng player, depende sa iyong layout). Nagpapakita ito ng "Connecting…" nang maigsi.
Magsalita nang normal
- Ano ang makikita mo: Pagkatapos ng 2–5 segundo, nagsisimulang lumabas ang teksto. Ang pinakabagong parirala ay nagpapakita ng mahinang animation habang pinoproseso pa ito.
Ipagpatuloy ang iyong pulong o pagre-rekord nang normal
- Ano ang makikita mo: Ang mga natapos na segment ay nagtatambak nang chronologically, bawat isa ay may tag na label ng speaker at timestamp.
Itigil ang pagre-rekord kapag tapos ka na
- Ano ang makikita mo: Bumabalik ang button sa idle state nito. Isang "Saving transcript…" na paunawa ay kumikislap nang maigsi, pagkatapos ay nawawala. Nini-store ang transcript.

Ano ang Makikita Mo Habang Nagre-rekord

Ang transcript panel ay may tatlong pangunahing lugar:

┌─────────────────────────────────────────────┐
│  Transcript                    🟢 Konektado  │
├─────────────────────────────────────────────┤
│  Speaker 1   0:00:12                        │
│  "Magandang umaga sa lahat, magsimula na    │
│   tayo"                                     │
│                                             │
│  Speaker 2   0:00:24                        │
│  "Salamat sa pagsali sa maikling abiso"     │
│                                             │
│  Speaker 1   0:00:31                        │
│  "Siyempre. Ang unang item sa agenda…"     │
├─────────────────────────────────────────────┤
│  Nagsasalita Na…  ████████░░░░              │
│  "…ay ang Q3 budget review"                 │
└─────────────────────────────────────────────┘

Ibig sabihin ng bawat elemento:

Elemento	Kahulugan
Label ng speaker	Sino ang nagsasalita — awtomatikong itinalaga ("Speaker 1", "Speaker 2")
Timestamp	Kailan sa rekording nagsisimula ang segment na ito (oras:minuto:segundo)
Natapos na teksto	Mga finalized na salita — hindi na ito magbabago
Preview na "Nagsasalita Na…"	Ang kasalukuyang utterance na pinoproseso pa — maaaring bahagyang magbago
Status indicator	🟢 Konektado · 🟡 Nagkokonekta · 🔴 Error

Connection Status Indicator

Ang indicator sa itaas-kanang sulok ng panel ay nagsasabi sa iyo kung maaabot ang AI engine:

🟢 Konektado — Normal na tumatakbo ang transkripsiyon
🟡 Nagkokonekta — Nagtatatag ng koneksyon (normal sa startup, tumatagal ng 2–5 segundo)
🔴 Error — Nawala ang koneksyon (tingnan ang Troubleshooting sa ibaba)

Kung makakita ka ng 🔴 Error, ang pagre-rekord mismo ay ligtas na nagpapatuloy—ang live na transkripsiyon lamang ang naapektuhan.

Awtomatikong Pagtuklas ng Speaker

Sinusubukan ng AI engine na makilala ang iba't ibang boses at magtalaga ng label sa bawat isa.

Paano ito gumagana:

Timeline ng pagre-rekord:

0:00 ──────────────────────────────────────────────────► oras
        │           │           │           │
      Speaker 1   Speaker 2   Speaker 1   Speaker 2
      "Umaga"     "Kumusta"   "Agenda…"   "Sumasang-ayon"
          ▼           ▼           ▼           ▼
      [Seg. 1]    [Seg. 2]    [Seg. 3]    [Seg. 4]

Sa bawat pagkakataon na nagbabago ang speaker, gumagawa ang sistema ng bagong segment. Ang mga segment mula sa parehong speaker ay nakakakuha ng parehong label.

Mga paunang label: Ang unang magsasalita ay "Speaker 1", ang pangalawang bagong boses ay "Speaker 2", at iba pa. Ito ay mga placeholder—maaari kang mag-rename ng mga ito mamaya (tingnan ang Kabanata 29).

Pag-refine ng speaker: Habang nagpapatuloy ang pagre-rekord, maaaring i-refine ng AI ang mga naunang assignment kung nagtitiwala ito na ang dalawang segment ay kabilang sa parehong boses. Ito ay normal. Hindi nagbabago ang teksto—ang attribution ng speaker lamang sa mga nakaraang segment.

Tip: Para sa pinaka-tumpak na paghihiwalay ng speaker, gumamit ng headphone sa halip na mga speaker. Ang output ng speaker na kinukuha ng iyong mikropono ay maaaring malito ang detector.

Pagkatapos Huminto ang Pagre-rekord

Kapag nag-click ka ng stop:

Ang preview na "Nagsasalita Na…" ay nini-finalize ang anumang hindi pa natapos na pangungusap
Ang kumpletong transcript ay awtomatikong nini-save kasabay ng iyong recording file
Hindi kailangan ng manu-manong aksyon

Kung saan hanapin ang transcript:

Buksan ang rekording sa iyong Recording Library
I-click ang AI Insights sa detail panel
Piliin ang tab na Transcript

Available din ang transcript para sa export bilang SRT (subtitle format) o JSON mula sa tab ng AI Insights. Tingnan ang Kabanata 28 para sa mga detalye ng export.

Mga Limitasyon

Ang pag-unawa sa mga limitasyong ito ay tumutulong na magtakda ng makatotohanang inaasahan:

Limitasyon	Detalye
Kailangan ng internet	Hindi maaaring tumakbo ang live na transkripsiyon nang offline. Pinoproseso ang audio ng isang AI engine sa pamamagitan ng network.
Katumpakan ng timestamp	Tinatayang mga timestamp (±3 segundo). Gamitin ang mga ito para sa navigation, hindi para sa legal na dokumentasyon.
Mga pause sa pagre-rekord	Kung ipo-pause mo ang pagre-rekord, nagpo-pause rin ang transkripsiyon. Ang mga paused na segment ay hindi nita-transkripsiyon.
Nag-iiba ang katumpakan	Pinakamataas ang katumpakan sa malinaw na pagsasalita, isang speaker nang sabay-sabay, at isang magandang mikropono. Binabawasan ng mabibigat na accent, background noise, o cross-talk ang katumpakan.
Wika	Ang wika ng transkripsiyon ay maaaring itakda sa Auto Detect (inirerekomenda) o isang partikular na wika sa Mga Setting → AI → SeaMeet Integration. Awtomatikong hinahawakan ng Auto Detect ang mga multilingual na pulong.
Walang real-time na pag-edit	Hindi mo maaaring i-edit ang transcript habang nagre-rekord. Available ang pag-edit pagkatapos tumigil ang pagre-rekord.

Caption Overlay Sa Panahon ng Pag-play Back

Kapag nag-play back ka ng rekording na may live transcript, maaaring magpakita ang SeaMeet ng mga caption nang direkta sa video — tulad ng closed caption sa TV.

Paano gumagana ang mga caption:

Ang caption text ay ini-overlay sa video preview sa ibaba ng frame
Nagpapakita ang bawat segment ng pangalan ng speaker (may kulay-code bawat speaker) at ang sinasalitang teksto
Naka-sync ang mga caption sa playback position — sumusulong sila habang nagpe-play ang rekording
Awtomatikong gumagamit ang mga caption ng Gemini Live transcript mula sa session

Mga kulay ng speaker: Bawat speaker ay itinalaga ng consistent na kulay sa lahat ng caption at transcript panel. Awtomatikong tinutukoy ang mga kulay at nananatiling consistent sa buong rekording.

Format ng caption:

[Speaker 1]: Magandang umaga sa lahat, magsimula na tayo.

Lumalabas at nawawala ang mga caption habang nagpe-play ang nagtutugmang transcript segment.

Two-Column na Layout ng Video

Kapag nanonood ng video recording na may available na live transcript, gumagamit ang SeaMeet ng two-column na layout:

┌─────────────────────────────────────────────────────┐
│  Preview ng Video          │  Transcript Panel       │
│                            │                         │
│  [video na may caption]    │  Speaker 1   0:00:12   │
│                            │  "Magandang umaga..."  │
│                            │                         │
│                            │  Speaker 2   0:00:24   │
│                            │  "Salamat sa pagsali"  │
│                            │              [⤢ Max]   │
└─────────────────────────────────────────────────────┘

Kaliwang kolumna: Fixed-width na video na may caption overlay
Kanang kolumna: Scrolling transcript panel, naka-sync sa playback position
Maximize button (⤢): Pinalawak ang transcript panel sa full-screen overlay para sa mas madaling pagbabasa sa mahabang mga rekording

Lumalabas lamang ang two-column na layout para sa mga video recording na may live transcript. Ang mga audio-only na rekording at mga rekording na walang transcript ay gumagamit ng standard na single-column na layout.

Mga Setting ng Wika para sa Transkripsiyon

Maaari mong i-configure kung aling wika ang inaasahan ng SeaMeet sa panahon ng live na transkripsiyon:

Buksan ang Mga Setting (⚙️)
Mag-navigate sa AI → SeaMeet Integration
Hanapin ang Meeting Language selector
Piliin ang iyong wika:
- Auto Detect (default, inirerekomenda) — Awtomatikong kinikilala ng SeaMeet ang sinasalitang wika. Pinakamainam para sa mga multilingual na pulong o kapag nag-iiba ang wika.
- Manual na pagpili — Pumili mula sa 20+ partikular na wika kabilang ang English (US/UK), Spanish, French, German, Japanese, Mandarin, Cantonese, Korean, at marami pa.

Tip: Panatilihing Auto Detect ang wika maliban kung may partikular kang dahilan para puwersahin ang isang wika. Mas mahusay ang auto detection sa mga accent at mixed-language na pulong kaysa sa isang manu-manong forced na setting.

Pag-aayos ng Mga Problema

"Hindi lumalabas ang transcript panel"

Sintomas: Nagsisimula kang mag-rekord ngunit hindi kailanman lumalabas ang transcript panel.

Suriin ito sa pagkakasunod-sunod:

Pumunta sa Mga Setting → AI at kumpirmahin na ang toggle ng Mga Tampok ng AI ay on
Kumpirmahin na valid ang iyong API key (berdeng checkmark sa Mga Setting → AI)
Suriin ang iyong koneksyon sa internet — subukang mag-load ng web page
I-restart ang SeaMeet at subukan muli

Kung hindi pa rin lumalabas ang panel pagkatapos ng lahat ng apat na hakbang, maaaring pansamantalang hindi available ang AI service. Ang pagre-rekord mismo ay hindi naapektuhan—subukan muli mamaya.

"Naputol ang koneksyon sa gitna ng pagre-rekord"

Sintomas: Ang status indicator ay nagiging 🔴 pula sa panahon ng pagre-rekord.

Nangyari: Naputol ang koneksyon sa AI engine. Maaari itong mangyari dahil sa:

Pansamantalang pagkaputol ng network
Nagpapalit ang Wi-Fi ng access point
Ang AI service ay pansamantalang nag-offline

Ano ang gagawin:

Huwag itigil ang pagre-rekord—nagpapatuloy ito nang ligtas
Suriin ang iyong koneksyon sa internet
Karaniwang awtomatikong nagre-recover ang koneksyon sa loob ng 30 segundo
Ang mga salitang sinabi sa panahon ng pagkaputol ay hindi mabawi—nawala ang mga ito para sa live transcript (ngunit nananatili ang audio sa recording file, kaya maaari kang magpatakbo ng AI Extraction pagkatapos ng katotohanan — tingnan ang Kabanata 28)

"Hindi tama ang label ng mga speaker"

Sintomas: Maraming tao ang may label na "Speaker 1", o isang tao ay lumalabas bilang dalawang iba't ibang speaker.

Nangyayari: Gumagamit ang pagtuklas ng speaker ng mga katangian ng boses. Bumababa ang katumpakan kapag:

Sabay-sabay na nagsasalita ang maraming tao
Makabuluhang nagbabago ang boses ng speaker (tumatawa, mataas ang boses, mahina ang audio)
Nakakaabala ang background noise

Ano ang gagawin:

Pagkatapos ng pagre-rekord, palitan ng pangalan ang mga speaker sa Speakers panel (tingnan ang Kabanata 29)
Gamitin ang Merge feature para pagsamahin ang dalawang label na kabilang sa parehong tao (Kabanata 29)

Pinakamainam na Mga Gawi

Sundin ang mga gawaing ito para sa pinakamainam na resulta ng live na transkripsiyon:

Isang speaker nang sabay-sabay Ang cross-talk (dalawang taong nagsasalita nang sabay) ay nagliligalig sa pagtuklas ng speaker at gumagawa ng magulo na teksto sa transcript. Hikayatin ang mga kalahok na mag-turn.

Tahimik na kapaligiran sa pagre-rekord Ang background noise—mga HVAC system, pag-type, ingay sa kalye—ay kinukuha ng mikropono at binabawasan ang katumpakan ng transkripsiyon. Ang isang headset microphone na inilalagay malapit sa bibig ay nagbibigay ng mas magandang resulta kaysa sa built-in na laptop microphone.

Magandang paglalagay ng mikropono Para sa mga in-person na pulong na may maraming kalahok, ilagay ang mikropono malapit sa gitna ng mesa, o gumamit ng individual na mikropono para sa bawat kalahok.

Matatag na koneksyon sa internet Gumamit ng wired na koneksyon o isang malakas na Wi-Fi signal. Iwasan ang mga hotspot o mga network na may mataas na packet loss—nagdudulot sila ng mga pagkaputol ng koneksyon.

Agad na palitan ng pangalan ang mga speaker Gawin ang pagpapalit ng pangalan ng speaker kaagad pagkatapos ng pagre-rekord habang natatandaan mo pa kung sino ang nagsabi ng ano. Tingnan ang Kabanata 29 para sa mga tagubilin.

Mabilis na Sanggunian

┌────────────────────────────────────────────────────────────┐
│                  LIVE NA TRANSKRIPSIYON                     │
│                   Mabilis na Sanggunian                     │
├────────────────────────────────────────────────────────────┤
│  Magsimula        │ Mag-rekord nang normal — auto-activates │
│  Status: berde    │ 🟢 Tumatakbo ang transkripsiyon         │
│  Status: dilaw    │ 🟡 Nagkokonekta (maghintay ng 5 s)      │
│  Status: pula     │ 🔴 Disconnected — ligtas ang rekording  │
├────────────────────────────────────────────────────────────┤
│  Transcript panel │ Kanang bahagi ng pangunahing window     │
│  Preview line     │ "Nagsasalita Na…" — in progress         │
│  Completed lines  │ Final — hindi na magbabago              │
├────────────────────────────────────────────────────────────┤
│  Pagkatapos huminto │ Awtomatikong nini-save ang transcript │
│  Hanapin ito     │ Rekording → AI Insights → Transcript    │
├────────────────────────────────────────────────────────────┤
│  Kailangan        │ Internet + Mga Tampok ng AI on + API key│
│  Mga Timestamp    │ Tinatayang ±3 segundo                   │
│  Mga Pause        │ Hindi nita-transkripsiyon               │
└────────────────────────────────────────────────────────────┘

Last updated: 2026-03-20

← Kabanata 26: Glossary of Terms | Kabanata 28: AI Extraction →