Transkripsi Langsung - Perkataan pada Skrin Semasa Anda Bercakap
Bab 27: Transkripsi Langsung — Perkataan pada Skrin Semasa Anda Bercakap
Bayangkan seorang jurucatat mahkamah yang menaip semasa sesi berlangsung—setiap perkataan ditangkap pada saat ia diucapkan, tanpa perlu menunggu sehingga mesyuarat tamat. Itulah yang dilakukan oleh transkripsi langsung SeaMeet untuk rakaman anda. Semasa anda bercakap, panel transkripsi terisi dalam masa nyata: label penutur, cap waktu, dan perkataan sebenar, semuanya muncul apabila perbualan berlaku.
Tanpa menunggu. Tanpa langkah muat naik. Hanya perkataan pada skrin.
Objektif Bab
Selepas membaca bab ini, anda akan dapat:
- Memahami apa yang dilakukan transkripsi langsung dan bila untuk menggunakannya
- Menyediakan prasyarat sebelum bermula
- Memulakan sesi rakaman dengan transkripsi langsung aktif
- Membaca dan mentafsir panel transkripsi semasa merakam
- Memahami cara pengesanan penutur automatik berfungsi
- Menyelesaikan masalah sambungan dan paparan yang paling biasa
Apakah Transkripsi Langsung?
Transkripsi langsung menukar audio dari rakaman anda menjadi teks semasa anda merakam, menghasilkan transkripsi yang dicap waktu dan berlabel penutur dalam masa nyata.
Fikirkan seperti ini: Bayangkan seorang jurumula taip duduk di sebelah anda dalam setiap mesyuarat, terus menulis semua yang diucapkan—melabelkan perkataan setiap orang dan mencatatkan masa tepat mereka bercakap. Transkripsi itu tersedia pada saat mesyuarat tamat. Tiada kelewatan transkripsi. Tiada penanda "memproses audio anda".
Transkripsi langsung berjalan bersama sesi rakaman anda. Pada saat anda mula merakam:
- Enjin AI mula mendengar
- Perkataan muncul dalam panel Transkripsi dalam beberapa saat selepas diucapkan
- Label penutur ("Penutur 1", "Penutur 2") diberikan secara automatik
- Cap waktu menandakan di mana dalam rakaman setiap segmen jatuh
Apabila anda berhenti merakam, transkripsi lengkap disimpan secara automatik bersama fail audio/video.
Sebelum Anda Bermula
Transkripsi langsung memerlukan dua perkara dikonfigurasi sebelum sesi pertama anda:
1. Ciri AI Diaktifkan
- Buka Tetapan (ikon gear ⚙️ di penjuru kanan atas)
- Navigasi ke kategori AI
- Sahkan togol Ciri AI hidup (biru)
Jika togol kelabu atau kategori AI tiada, hubungi pentadbir akaun anda—ciri AI mungkin memerlukan langganan aktif.
2. Kunci API Dikonfigurasi
Masih dalam Tetapan → AI:
- Cari medan Kunci API
- Masukkan kunci API Gemini anda (lihat Bab 31 untuk cara mendapatkannya)
- Klik Simpan
Tanda semak hijau mengesahkan kunci adalah sah. Amaran merah bermakna kunci salah atau telah tamat tempoh.
Nota: Anda memerlukan sambungan internet aktif semasa rakaman. Transkripsi langsung tidak boleh dijalankan di luar talian.
Cara Memulakan Sesi Transkripsi Langsung
Memulakan transkripsi langsung adalah sama dengan memulakan sebarang rakaman—tiada "mod transkripsi" berasingan yang perlu diaktifkan. Jika Ciri AI dihidupkan dan kunci API dikonfigurasi, transkripsi langsung diaktifkan secara automatik.
Langkah demi langkah:
-
Klik butang rekod merah 🔴 (atau gunakan pintasan papan kekunci:
Ctrl+Alt+Apada Windows,Cmd+Shift+Apada macOS)- Apa yang anda lihat: Butang berdenyut merah. Pemasa rakaman mula mengira.
-
Perhatikan panel Transkripsi muncul
- Apa yang anda lihat: Panel meluncur masuk di sebelah kanan tetingkap utama (atau di bawah pemain, bergantung pada susun atur anda). Ia menunjukkan "Menyambung..." sebentar.
-
Bercakap seperti biasa
- Apa yang anda lihat: Selepas 2–5 saat, teks mula muncul. Frasa terkini menunjukkan animasi halus semasa masih diproses.
-
Teruskan mesyuarat atau rakaman anda seperti biasa
- Apa yang anda lihat: Segmen yang selesai tersusun secara kronologi, masing-masing ditag dengan label penutur dan cap waktu.
-
Hentikan rakaman apabila selesai
- Apa yang anda lihat: Butang kembali ke keadaan senyap. Notis "Menyimpan transkripsi..." berkelip sebentar, kemudian hilang. Transkripsi disimpan.
Apa yang Anda Lihat Semasa Merakam
Panel transkripsi mempunyai tiga kawasan utama:
┌─────────────────────────────────────────────┐
│ Transkripsi 🟢 Tersambung │
├─────────────────────────────────────────────┤
│ Penutur 1 0:00:12 │
│ "Selamat pagi semua, mari kita mulakan" │
│ │
│ Penutur 2 0:00:24 │
│ "Terima kasih kerana menyertai" │
│ │
│ Penutur 1 0:00:31 │
│ "Tentu. Item pertama dalam agenda…" │
├─────────────────────────────────────────────┤
│ Sedang Bercakap… ████████░░░░ │
│ "…adalah semakan bajet S3" │
└─────────────────────────────────────────────┘
Maksud setiap elemen:
| Elemen | Maksud |
|---|---|
| Label penutur | Siapa yang bercakap — diberikan secara automatik ("Penutur 1", "Penutur 2") |
| Cap waktu | Bila dalam rakaman segmen ini bermula (jam:minit:saat) |
| Teks selesai | Perkataan yang dimuktamadkan — ini tidak berubah |
| Pratonton "Sedang Bercakap…" | Ucapan semasa yang masih diproses — mungkin berubah sedikit |
| Penunjuk status | 🟢 Tersambung · 🟡 Menyambung · 🔴 Ralat |
Penunjuk Status Sambungan
Penunjuk di penjuru kanan atas panel memberitahu anda sama ada enjin AI boleh dicapai:
- 🟢 Tersambung — Transkripsi berjalan dengan normal
- 🟡 Menyambung — Mewujudkan sambungan (normal semasa permulaan, mengambil masa 2–5 saat)
- 🔴 Ralat — Sambungan terputus (lihat Penyelesaian Masalah di bawah)
Jika anda melihat 🔴 Ralat, rakaman itu sendiri terus selamat—hanya transkripsi langsung yang terjejas.
Pengesanan Penutur Automatik
Enjin AI cuba membezakan antara suara yang berbeza dan memberikan label kepada setiap satu.
Cara kerjanya:
Garis masa rakaman:
0:00 ──────────────────────────────────────────────────► masa
│ │ │ │
Penutur 1 Penutur 2 Penutur 1 Penutur 2
"Pagi" "Helo" "Agenda…" "Setuju"
▼ ▼ ▼ ▼
[Seg. 1] [Seg. 2] [Seg. 3] [Seg. 4]
Setiap kali penutur bertukar, sistem mencipta segmen baharu. Segmen dari penutur yang sama mendapat label yang sama.
Label awal: Penutur pertama yang bercakap ialah "Penutur 1", suara baharu kedua ialah "Penutur 2", dan seterusnya. Ini adalah ruang letak—anda boleh menamakan semula kemudian (lihat Bab 29).
Penapisan penutur: Apabila rakaman berlangsung, AI mungkin menapis tugasan lebih awal jika ia menjadi yakin bahawa dua segmen milik suara yang sama. Ini adalah normal. Teks tidak berubah—hanya atribusi penutur pada segmen yang lalu.
Petua: Untuk pemisahan penutur yang paling tepat, gunakan fon kepala dan bukannya pembesar suara. Output pembesar suara yang ditangkap oleh mikrofon anda boleh mengelirukan pengesan.
Selepas Rakaman Berhenti
Apabila anda klik berhenti:
- Pratonton "Sedang Bercakap…" memuktamadkan sebarang ayat yang sedang dalam proses
- Transkripsi lengkap disimpan bersama fail rakaman anda secara automatik
- Tiada tindakan manual diperlukan
Di mana untuk mencari transkripsi:
- Buka rakaman dalam Pustaka Rakaman anda
- Klik AI Insights dalam panel butiran
- Pilih tab Transkripsi
Transkripsi juga tersedia untuk eksport sebagai SRT (format sari kata) atau JSON dari tab AI Insights. Lihat Bab 28 untuk butiran eksport.
Had
Memahami had ini membantu menetapkan jangkaan yang realistik:
| Had | Butiran |
|---|---|
| Memerlukan internet | Transkripsi langsung tidak boleh dijalankan di luar talian. Audio diproses oleh enjin AI melalui rangkaian. |
| Ketepatan cap waktu | Cap waktu adalah anggaran (±3 saat). Gunakan untuk navigasi, bukan dokumentasi undang-undang. |
| Jeda dalam rakaman | Jika anda menjeda rakaman, transkripsi juga menjeda. Segmen yang dijeda tidak ditranskripsi. |
| Ketepatan berbeza-beza | Ketepatan paling tinggi dengan ucapan yang jelas, satu penutur pada satu masa, dan mikrofon yang baik. Loghat yang kuat, bunyi latar belakang, atau pertuturan silang mengurangkan ketepatan. |
| Bahasa | Bahasa transkripsi boleh ditetapkan ke Auto Detect (disyorkan) atau bahasa tertentu dalam Tetapan → AI → SeaMeet Integration. Auto Detect mengendalikan mesyuarat berbilang bahasa secara automatik. |
| Tiada penyuntingan masa nyata | Anda tidak boleh menyunting transkripsi semasa merakam. Penyuntingan tersedia selepas rakaman berhenti. |
Lapisan Kapsyen Semasa Main Semula
Apabila anda memainkan semula rakaman yang mempunyai transkripsi langsung, SeaMeet boleh memaparkan kapsyen terus pada video — seperti kapsyen tertutup pada TV.
Cara kapsyen berfungsi:
- Teks kapsyen dilapisi pada pratonton video di bahagian bawah bingkai
- Setiap segmen menunjukkan nama penutur (dikodkan warna per penutur) dan teks yang diucapkan
- Kapsyen disegerakkan dengan kedudukan main semula — ia maju apabila rakaman dimainkan
- Kapsyen secara automatik menggunakan transkripsi Gemini Live dari sesi tersebut
Warna penutur: Setiap penutur diberikan warna yang konsisten merentasi semua kapsyen dan panel transkripsi. Warna ditentukan secara automatik dan kekal konsisten sepanjang rakaman.
Format kapsyen:
[Penutur 1]: Selamat pagi semua, mari kita mulakan.
Kapsyen muncul dan menghilang apabila segmen transkripsi yang sepadan dimainkan.
Susun Atur Video Dua Lajur
Apabila menonton rakaman video dengan transkripsi langsung yang tersedia, SeaMeet menggunakan susun atur dua lajur:
┌─────────────────────────────────────────────────────┐
│ Pratonton Video │ Panel Transkripsi │
│ │ │
│ [video dengan kapsyen] │ Penutur 1 0:00:12 │
│ │ "Selamat pagi..." │
│ │ │
│ │ Penutur 2 0:00:24 │
│ │ "Terima kasih" │
│ │ [⤢ Max] │
└─────────────────────────────────────────────────────┘
- Lajur kiri: Video lebar tetap dengan lapisan kapsyen
- Lajur kanan: Panel transkripsi tatal, disegerakkan dengan kedudukan main semula
- Butang Maksimum (⤢): Mengembangkan panel transkripsi ke lapisan skrin penuh untuk pembacaan yang lebih mudah semasa rakaman panjang
Susun atur dua lajur hanya muncul untuk rakaman video dengan transkripsi langsung. Rakaman audio sahaja dan rakaman tanpa transkripsi menggunakan susun atur satu lajur standard.
Tetapan Bahasa untuk Transkripsi
Anda boleh mengkonfigurasi bahasa yang dijangka SeaMeet semasa transkripsi langsung:
- Buka Tetapan (⚙️)
- Navigasi ke AI → SeaMeet Integration
- Cari pemilih Bahasa Mesyuarat
- Pilih bahasa anda:
- Auto Detect (lalai, disyorkan) — SeaMeet secara automatik mengenal pasti bahasa yang dituturkan. Terbaik untuk mesyuarat berbilang bahasa atau apabila bahasa berbeza.
- Pilihan manual — Pilih dari 20+ bahasa khusus termasuk Inggeris (AS/UK), Sepanyol, Perancis, Jerman, Jepun, Mandarin, Kantonis, Korea, dan banyak lagi.
Petua: Biarkan bahasa ditetapkan ke Auto Detect melainkan anda mempunyai sebab khusus untuk memaksa bahasa. Pengesanan automatik mengendalikan loghat dan mesyuarat berbahasa campuran dengan lebih baik daripada tetapan yang dipaksa secara manual.
Penyelesaian Masalah
"Panel transkripsi tidak muncul"
Simptom: Anda mula merakam tetapi panel transkripsi tidak pernah muncul.
Semak ini mengikut urutan:
- Pergi ke Tetapan → AI dan sahkan togol Ciri AI hidup
- Sahkan kunci API anda sah (tanda semak hijau dalam Tetapan → AI)
- Semak sambungan internet anda — cuba memuatkan halaman web
- Mulakan semula SeaMeet dan cuba semula
Jika panel masih tidak muncul selepas keempat-empat langkah, perkhidmatan AI mungkin tidak tersedia sementara. Rakaman itu sendiri tidak terjejas—cuba semula kemudian.
"Sambungan terputus semasa rakaman"
Simptom: Penunjuk status bertukar 🔴 merah semasa rakaman.
Apa yang berlaku: Sambungan ke enjin AI terganggu. Ini boleh berlaku disebabkan:
- Gangguan rangkaian sementara
- Wi-Fi bertukar titik akses
- Perkhidmatan AI yang sebentar di luar talian
Apa yang perlu dilakukan:
- Jangan hentikan rakaman—ia terus selamat
- Semak sambungan internet anda
- Sambungan biasanya pulih secara automatik dalam 30 saat
- Perkataan yang diucapkan semasa tempoh pemutusan tidak dipulihkan—ia hilang untuk transkripsi langsung (tetapi audio kekal dalam fail rakaman, jadi anda boleh menjalankan AI Extraction selepas itu — lihat Bab 28)
"Penutur tidak dilabelkan dengan betul"
Simptom: Berbilang orang dilabelkan sebagai "Penutur 1", atau satu orang muncul sebagai dua penutur yang berbeza.
Apa yang berlaku: Pengesanan penutur menggunakan ciri suara. Ketepatan berkurangan apabila:
- Berbilang orang bercakap pada masa yang sama
- Suara penutur berubah dengan ketara (ketawa, suara tinggi, audio yang buruk)
- Bunyi latar belakang mengganggu
Apa yang perlu dilakukan:
- Selepas rakaman, namakan semula penutur dalam panel Penutur (lihat Bab 29)
- Gunakan ciri Gabung untuk menggabungkan dua label yang milik orang yang sama (Bab 29)
Amalan Terbaik
Ikuti amalan ini untuk hasil transkripsi langsung yang terbaik:
Satu penutur pada satu masa Pertuturan silang (dua orang bercakap serentak) mengelirukan pengesanan penutur dan menghasilkan teks yang tidak jelas dalam transkripsi. Galakkan peserta untuk bergilir-gilir.
Persekitaran rakaman yang senyap Bunyi latar belakang—sistem HVAC, menaip, bunyi jalanan—ditangkap oleh mikrofon dan mengurangkan ketepatan transkripsi. Mikrofon set kepala yang ditempatkan dekat dengan mulut memberikan hasil yang jauh lebih baik daripada mikrofon komputer riba terbina dalam.
Penempatan mikrofon yang baik Untuk mesyuarat secara peribadi dengan berbilang peserta, letakkan mikrofon berhampiran pusat meja, atau gunakan mikrofon individu untuk setiap peserta.
Sambungan internet yang stabil Gunakan sambungan berwayar atau isyarat Wi-Fi yang kuat. Elakkan hotspot atau rangkaian dengan kehilangan paket yang tinggi—ia menyebabkan pemutusan sambungan.
Namakan semula penutur dengan segera Lakukan penamaan semula penutur serta-merta selepas rakaman semasa anda masih ingat siapa yang berkata apa. Lihat Bab 29 untuk arahan.
Rujukan Pantas
┌────────────────────────────────────────────────────────────┐
│ TRANSKRIPSI LANGSUNG │
│ Rujukan Pantas │
├────────────────────────────────────────────────────────────┤
│ Mulakan │ Rakam seperti biasa — aktif auto │
│ Status: hijau │ 🟢 Transkripsi berjalan │
│ Status: kuning │ 🟡 Menyambung (tunggu 5 s) │
│ Status: merah │ 🔴 Terputus — rakaman selamat │
├────────────────────────────────────────────────────────────┤
│ Panel transkripsi│ Sebelah kanan tetingkap utama │
│ Baris pratonton │ "Sedang Bercakap…" — dalam proses │
│ Baris selesai │ Muktamad — tidak akan berubah │
├────────────────────────────────────────────────────────────┤
│ Selepas berhenti │ Transkripsi disimpan secara automatik │
│ Carinya │ Rakaman → AI Insights → Transkripsi │
├────────────────────────────────────────────────────────────┤
│ Memerlukan │ Internet + Ciri AI hidup + Kunci API │
│ Cap waktu │ Anggaran ±3 saat │
│ Jeda │ Tidak ditranskripsi │
└────────────────────────────────────────────────────────────┘
Last updated: 2026-03-20
Published: