Bab 27: Transkripsi Langsung — Perkataan pada Skrin Semasa Anda Bercakap

Bayangkan seorang jurucatat mahkamah yang menaip semasa sesi berlangsung—setiap perkataan ditangkap pada saat ia diucapkan, tanpa perlu menunggu sehingga mesyuarat tamat. Itulah yang dilakukan oleh transkripsi langsung SeaMeet untuk rakaman anda. Semasa anda bercakap, panel transkripsi terisi dalam masa nyata: label penutur, cap waktu, dan perkataan sebenar, semuanya muncul apabila perbualan berlaku.

Tanpa menunggu. Tanpa langkah muat naik. Hanya perkataan pada skrin.

Objektif Bab

Selepas membaca bab ini, anda akan dapat:

Memahami apa yang dilakukan transkripsi langsung dan bila untuk menggunakannya
Menyediakan prasyarat sebelum bermula
Memulakan sesi rakaman dengan transkripsi langsung aktif
Membaca dan mentafsir panel transkripsi semasa merakam
Memahami cara pengesanan penutur automatik berfungsi
Menyelesaikan masalah sambungan dan paparan yang paling biasa

Apakah Transkripsi Langsung?

Transkripsi langsung menukar audio dari rakaman anda menjadi teks semasa anda merakam, menghasilkan transkripsi yang dicap waktu dan berlabel penutur dalam masa nyata.

Fikirkan seperti ini: Bayangkan seorang jurumula taip duduk di sebelah anda dalam setiap mesyuarat, terus menulis semua yang diucapkan—melabelkan perkataan setiap orang dan mencatatkan masa tepat mereka bercakap. Transkripsi itu tersedia pada saat mesyuarat tamat. Tiada kelewatan transkripsi. Tiada penanda "memproses audio anda".

Transkripsi langsung berjalan bersama sesi rakaman anda. Pada saat anda mula merakam:

Enjin AI mula mendengar
Perkataan muncul dalam panel Transkripsi dalam beberapa saat selepas diucapkan
Label penutur ("Penutur 1", "Penutur 2") diberikan secara automatik
Cap waktu menandakan di mana dalam rakaman setiap segmen jatuh

Apabila anda berhenti merakam, transkripsi lengkap disimpan secara automatik bersama fail audio/video.

Sebelum Anda Bermula

Transkripsi langsung memerlukan dua perkara dikonfigurasi sebelum sesi pertama anda:

1. Ciri AI Diaktifkan

Buka Tetapan (ikon gear ⚙️ di penjuru kanan atas)
Navigasi ke kategori AI
Sahkan togol Ciri AI hidup (biru)

Jika togol kelabu atau kategori AI tiada, hubungi pentadbir akaun anda—ciri AI mungkin memerlukan langganan aktif.

2. Kunci API Dikonfigurasi

Masih dalam Tetapan → AI:

Cari medan Kunci API
Masukkan kunci API Gemini anda (lihat Bab 31 untuk cara mendapatkannya)
Klik Simpan

Tanda semak hijau mengesahkan kunci adalah sah. Amaran merah bermakna kunci salah atau telah tamat tempoh.

Nota: Anda memerlukan sambungan internet aktif semasa rakaman. Transkripsi langsung tidak boleh dijalankan di luar talian.

Cara Memulakan Sesi Transkripsi Langsung

Memulakan transkripsi langsung adalah sama dengan memulakan sebarang rakaman—tiada "mod transkripsi" berasingan yang perlu diaktifkan. Jika Ciri AI dihidupkan dan kunci API dikonfigurasi, transkripsi langsung diaktifkan secara automatik.

Langkah demi langkah:

Klik butang rekod merah 🔴 (atau gunakan pintasan papan kekunci: Ctrl+Alt+A pada Windows, Cmd+Shift+A pada macOS)
- Apa yang anda lihat: Butang berdenyut merah. Pemasa rakaman mula mengira.
Perhatikan panel Transkripsi muncul
- Apa yang anda lihat: Panel meluncur masuk di sebelah kanan tetingkap utama (atau di bawah pemain, bergantung pada susun atur anda). Ia menunjukkan "Menyambung..." sebentar.
Bercakap seperti biasa
- Apa yang anda lihat: Selepas 2–5 saat, teks mula muncul. Frasa terkini menunjukkan animasi halus semasa masih diproses.
Teruskan mesyuarat atau rakaman anda seperti biasa
- Apa yang anda lihat: Segmen yang selesai tersusun secara kronologi, masing-masing ditag dengan label penutur dan cap waktu.
Hentikan rakaman apabila selesai
- Apa yang anda lihat: Butang kembali ke keadaan senyap. Notis "Menyimpan transkripsi..." berkelip sebentar, kemudian hilang. Transkripsi disimpan.

Apa yang Anda Lihat Semasa Merakam

Panel transkripsi mempunyai tiga kawasan utama:

┌─────────────────────────────────────────────┐
│  Transkripsi                   🟢 Tersambung │
├─────────────────────────────────────────────┤
│  Penutur 1   0:00:12                        │
│  "Selamat pagi semua, mari kita mulakan"    │
│                                             │
│  Penutur 2   0:00:24                        │
│  "Terima kasih kerana menyertai"            │
│                                             │
│  Penutur 1   0:00:31                        │
│  "Tentu. Item pertama dalam agenda…"        │
├─────────────────────────────────────────────┤
│  Sedang Bercakap…  ████████░░░░             │
│  "…adalah semakan bajet S3"                 │
└─────────────────────────────────────────────┘

Maksud setiap elemen:

Elemen	Maksud
Label penutur	Siapa yang bercakap — diberikan secara automatik ("Penutur 1", "Penutur 2")
Cap waktu	Bila dalam rakaman segmen ini bermula (jam:minit:saat)
Teks selesai	Perkataan yang dimuktamadkan — ini tidak berubah
Pratonton "Sedang Bercakap…"	Ucapan semasa yang masih diproses — mungkin berubah sedikit
Penunjuk status	🟢 Tersambung · 🟡 Menyambung · 🔴 Ralat

Penunjuk Status Sambungan

Penunjuk di penjuru kanan atas panel memberitahu anda sama ada enjin AI boleh dicapai:

🟢 Tersambung — Transkripsi berjalan dengan normal
🟡 Menyambung — Mewujudkan sambungan (normal semasa permulaan, mengambil masa 2–5 saat)
🔴 Ralat — Sambungan terputus (lihat Penyelesaian Masalah di bawah)

Jika anda melihat 🔴 Ralat, rakaman itu sendiri terus selamat—hanya transkripsi langsung yang terjejas.

Pengesanan Penutur Automatik

Enjin AI cuba membezakan antara suara yang berbeza dan memberikan label kepada setiap satu.

Cara kerjanya:

Garis masa rakaman:

0:00 ──────────────────────────────────────────────────► masa
        │           │           │           │
      Penutur 1   Penutur 2   Penutur 1   Penutur 2
      "Pagi"      "Helo"      "Agenda…"   "Setuju"
          ▼           ▼           ▼           ▼
      [Seg. 1]    [Seg. 2]    [Seg. 3]    [Seg. 4]

Setiap kali penutur bertukar, sistem mencipta segmen baharu. Segmen dari penutur yang sama mendapat label yang sama.

Label awal: Penutur pertama yang bercakap ialah "Penutur 1", suara baharu kedua ialah "Penutur 2", dan seterusnya. Ini adalah ruang letak—anda boleh menamakan semula kemudian (lihat Bab 29).

Penapisan penutur: Apabila rakaman berlangsung, AI mungkin menapis tugasan lebih awal jika ia menjadi yakin bahawa dua segmen milik suara yang sama. Ini adalah normal. Teks tidak berubah—hanya atribusi penutur pada segmen yang lalu.

Petua: Untuk pemisahan penutur yang paling tepat, gunakan fon kepala dan bukannya pembesar suara. Output pembesar suara yang ditangkap oleh mikrofon anda boleh mengelirukan pengesan.

Selepas Rakaman Berhenti

Apabila anda klik berhenti:

Pratonton "Sedang Bercakap…" memuktamadkan sebarang ayat yang sedang dalam proses
Transkripsi lengkap disimpan bersama fail rakaman anda secara automatik
Tiada tindakan manual diperlukan

Di mana untuk mencari transkripsi:

Buka rakaman dalam Pustaka Rakaman anda
Klik AI Insights dalam panel butiran
Pilih tab Transkripsi

Transkripsi juga tersedia untuk eksport sebagai SRT (format sari kata) atau JSON dari tab AI Insights. Lihat Bab 28 untuk butiran eksport.

Had

Memahami had ini membantu menetapkan jangkaan yang realistik:

Had	Butiran
Memerlukan internet	Transkripsi langsung tidak boleh dijalankan di luar talian. Audio diproses oleh enjin AI melalui rangkaian.
Ketepatan cap waktu	Cap waktu adalah anggaran (±3 saat). Gunakan untuk navigasi, bukan dokumentasi undang-undang.
Jeda dalam rakaman	Jika anda menjeda rakaman, transkripsi juga menjeda. Segmen yang dijeda tidak ditranskripsi.
Ketepatan berbeza-beza	Ketepatan paling tinggi dengan ucapan yang jelas, satu penutur pada satu masa, dan mikrofon yang baik. Loghat yang kuat, bunyi latar belakang, atau pertuturan silang mengurangkan ketepatan.
Bahasa	Bahasa transkripsi boleh ditetapkan ke Auto Detect (disyorkan) atau bahasa tertentu dalam Tetapan → AI → SeaMeet Integration. Auto Detect mengendalikan mesyuarat berbilang bahasa secara automatik.
Tiada penyuntingan masa nyata	Anda tidak boleh menyunting transkripsi semasa merakam. Penyuntingan tersedia selepas rakaman berhenti.

Lapisan Kapsyen Semasa Main Semula

Apabila anda memainkan semula rakaman yang mempunyai transkripsi langsung, SeaMeet boleh memaparkan kapsyen terus pada video — seperti kapsyen tertutup pada TV.

Cara kapsyen berfungsi:

Teks kapsyen dilapisi pada pratonton video di bahagian bawah bingkai
Setiap segmen menunjukkan nama penutur (dikodkan warna per penutur) dan teks yang diucapkan
Kapsyen disegerakkan dengan kedudukan main semula — ia maju apabila rakaman dimainkan
Kapsyen secara automatik menggunakan transkripsi Gemini Live dari sesi tersebut

Warna penutur: Setiap penutur diberikan warna yang konsisten merentasi semua kapsyen dan panel transkripsi. Warna ditentukan secara automatik dan kekal konsisten sepanjang rakaman.

Format kapsyen:

[Penutur 1]: Selamat pagi semua, mari kita mulakan.

Kapsyen muncul dan menghilang apabila segmen transkripsi yang sepadan dimainkan.

Susun Atur Video Dua Lajur

Apabila menonton rakaman video dengan transkripsi langsung yang tersedia, SeaMeet menggunakan susun atur dua lajur:

┌─────────────────────────────────────────────────────┐
│  Pratonton Video           │  Panel Transkripsi       │
│                            │                         │
│  [video dengan kapsyen]    │  Penutur 1   0:00:12   │
│                            │  "Selamat pagi..."     │
│                            │                         │
│                            │  Penutur 2   0:00:24   │
│                            │  "Terima kasih"        │
│                            │              [⤢ Max]   │
└─────────────────────────────────────────────────────┘

Lajur kiri: Video lebar tetap dengan lapisan kapsyen
Lajur kanan: Panel transkripsi tatal, disegerakkan dengan kedudukan main semula
Butang Maksimum (⤢): Mengembangkan panel transkripsi ke lapisan skrin penuh untuk pembacaan yang lebih mudah semasa rakaman panjang

Susun atur dua lajur hanya muncul untuk rakaman video dengan transkripsi langsung. Rakaman audio sahaja dan rakaman tanpa transkripsi menggunakan susun atur satu lajur standard.

Tetapan Bahasa untuk Transkripsi

Anda boleh mengkonfigurasi bahasa yang dijangka SeaMeet semasa transkripsi langsung:

Buka Tetapan (⚙️)
Navigasi ke AI → SeaMeet Integration
Cari pemilih Bahasa Mesyuarat
Pilih bahasa anda:
- Auto Detect (lalai, disyorkan) — SeaMeet secara automatik mengenal pasti bahasa yang dituturkan. Terbaik untuk mesyuarat berbilang bahasa atau apabila bahasa berbeza.
- Pilihan manual — Pilih dari 20+ bahasa khusus termasuk Inggeris (AS/UK), Sepanyol, Perancis, Jerman, Jepun, Mandarin, Kantonis, Korea, dan banyak lagi.

Petua: Biarkan bahasa ditetapkan ke Auto Detect melainkan anda mempunyai sebab khusus untuk memaksa bahasa. Pengesanan automatik mengendalikan loghat dan mesyuarat berbahasa campuran dengan lebih baik daripada tetapan yang dipaksa secara manual.

Penyelesaian Masalah

"Panel transkripsi tidak muncul"

Simptom: Anda mula merakam tetapi panel transkripsi tidak pernah muncul.

Semak ini mengikut urutan:

Pergi ke Tetapan → AI dan sahkan togol Ciri AI hidup
Sahkan kunci API anda sah (tanda semak hijau dalam Tetapan → AI)
Semak sambungan internet anda — cuba memuatkan halaman web
Mulakan semula SeaMeet dan cuba semula

Jika panel masih tidak muncul selepas keempat-empat langkah, perkhidmatan AI mungkin tidak tersedia sementara. Rakaman itu sendiri tidak terjejas—cuba semula kemudian.

"Sambungan terputus semasa rakaman"

Simptom: Penunjuk status bertukar 🔴 merah semasa rakaman.

Apa yang berlaku: Sambungan ke enjin AI terganggu. Ini boleh berlaku disebabkan:

Gangguan rangkaian sementara
Wi-Fi bertukar titik akses
Perkhidmatan AI yang sebentar di luar talian

Apa yang perlu dilakukan:

Jangan hentikan rakaman—ia terus selamat
Semak sambungan internet anda
Sambungan biasanya pulih secara automatik dalam 30 saat
Perkataan yang diucapkan semasa tempoh pemutusan tidak dipulihkan—ia hilang untuk transkripsi langsung (tetapi audio kekal dalam fail rakaman, jadi anda boleh menjalankan AI Extraction selepas itu — lihat Bab 28)

"Penutur tidak dilabelkan dengan betul"

Simptom: Berbilang orang dilabelkan sebagai "Penutur 1", atau satu orang muncul sebagai dua penutur yang berbeza.

Apa yang berlaku: Pengesanan penutur menggunakan ciri suara. Ketepatan berkurangan apabila:

Berbilang orang bercakap pada masa yang sama
Suara penutur berubah dengan ketara (ketawa, suara tinggi, audio yang buruk)
Bunyi latar belakang mengganggu

Apa yang perlu dilakukan:

Selepas rakaman, namakan semula penutur dalam panel Penutur (lihat Bab 29)
Gunakan ciri Gabung untuk menggabungkan dua label yang milik orang yang sama (Bab 29)

Amalan Terbaik

Ikuti amalan ini untuk hasil transkripsi langsung yang terbaik:

Satu penutur pada satu masa Pertuturan silang (dua orang bercakap serentak) mengelirukan pengesanan penutur dan menghasilkan teks yang tidak jelas dalam transkripsi. Galakkan peserta untuk bergilir-gilir.

Persekitaran rakaman yang senyap Bunyi latar belakang—sistem HVAC, menaip, bunyi jalanan—ditangkap oleh mikrofon dan mengurangkan ketepatan transkripsi. Mikrofon set kepala yang ditempatkan dekat dengan mulut memberikan hasil yang jauh lebih baik daripada mikrofon komputer riba terbina dalam.

Penempatan mikrofon yang baik Untuk mesyuarat secara peribadi dengan berbilang peserta, letakkan mikrofon berhampiran pusat meja, atau gunakan mikrofon individu untuk setiap peserta.

Sambungan internet yang stabil Gunakan sambungan berwayar atau isyarat Wi-Fi yang kuat. Elakkan hotspot atau rangkaian dengan kehilangan paket yang tinggi—ia menyebabkan pemutusan sambungan.

Namakan semula penutur dengan segera Lakukan penamaan semula penutur serta-merta selepas rakaman semasa anda masih ingat siapa yang berkata apa. Lihat Bab 29 untuk arahan.

Rujukan Pantas

┌────────────────────────────────────────────────────────────┐
│                  TRANSKRIPSI LANGSUNG                       │
│                   Rujukan Pantas                            │
├────────────────────────────────────────────────────────────┤
│  Mulakan          │ Rakam seperti biasa — aktif auto       │
│  Status: hijau    │ 🟢 Transkripsi berjalan               │
│  Status: kuning   │ 🟡 Menyambung (tunggu 5 s)            │
│  Status: merah    │ 🔴 Terputus — rakaman selamat          │
├────────────────────────────────────────────────────────────┤
│  Panel transkripsi│ Sebelah kanan tetingkap utama          │
│  Baris pratonton  │ "Sedang Bercakap…" — dalam proses      │
│  Baris selesai    │ Muktamad — tidak akan berubah          │
├────────────────────────────────────────────────────────────┤
│  Selepas berhenti │ Transkripsi disimpan secara automatik  │
│  Carinya          │ Rakaman → AI Insights → Transkripsi   │
├────────────────────────────────────────────────────────────┤
│  Memerlukan       │ Internet + Ciri AI hidup + Kunci API   │
│  Cap waktu        │ Anggaran ±3 saat                       │
│  Jeda             │ Tidak ditranskripsi                    │
└────────────────────────────────────────────────────────────┘

Last updated: 2026-03-20

← Bab 26: Glosari Istilah | Bab 28: AI Extraction →

Transkripsi Langsung - Perkataan pada Skrin Semasa Anda Bercakap