Transkripsi Langsung - Kata-Kata di Layar Saat Anda Berbicara
Bab 27: Transkripsi Langsung — Kata-Kata di Layar Saat Anda Berbicara
Bayangkan seorang juru tulis pengadilan yang mengetik saat sesi berlangsung—setiap kata direkam saat diucapkan, tanpa menunggu sampai rapat berakhir. Itulah tepatnya yang dilakukan transkripsi langsung SeaMeet untuk rekaman Anda. Saat Anda berbicara, panel transkrip terisi secara real time: label pembicara, stempel waktu, dan kata-kata yang sebenarnya, semuanya muncul saat percakapan berlangsung.
Tidak perlu menunggu. Tidak ada langkah unggah. Hanya kata-kata di layar.
Tujuan Bab
Setelah membaca bab ini, Anda akan mampu:
- Memahami apa yang dilakukan transkripsi langsung dan kapan menggunakannya
- Menyiapkan prasyarat sebelum memulai
- Memulai sesi perekaman dengan transkripsi langsung aktif
- Membaca dan menginterpretasikan panel transkrip saat merekam
- Memahami cara kerja deteksi pembicara otomatis
- Memecahkan masalah koneksi dan tampilan yang paling umum
Apa Itu Transkripsi Langsung?
Transkripsi langsung mengubah audio dari rekaman Anda menjadi teks saat Anda merekam, menghasilkan transkrip yang diberi stempel waktu dan dilabeli pembicara secara real time.
Anggap seperti ini: Bayangkan seorang juru tik duduk di sebelah Anda di setiap rapat, langsung menuliskan semua yang dikatakan—melabeli kata-kata setiap orang dan mencatat waktu persis mereka berbicara. Transkrip itu tersedia segera setelah rapat berakhir. Tidak ada penundaan transkripsi. Tidak ada spinner "sedang memproses audio Anda".
Transkripsi langsung berjalan bersamaan dengan sesi perekaman Anda. Saat Anda mulai merekam:
- Mesin AI mulai mendengarkan
- Kata-kata muncul di panel Transkrip dalam beberapa detik setelah diucapkan
- Label pembicara ("Speaker 1", "Speaker 2") ditetapkan secara otomatis
- Stempel waktu menandai posisi dalam rekaman setiap segmen
Saat Anda berhenti merekam, transkrip lengkap disimpan secara otomatis bersama file audio/video.
Sebelum Anda Mulai
Transkripsi langsung memerlukan dua hal yang dikonfigurasi sebelum sesi pertama Anda:
1. Fitur AI Diaktifkan
- Buka Pengaturan (ikon roda gigi ⚙️ di sudut kanan atas)
- Navigasikan ke kategori AI
- Konfirmasi toggle Fitur AI aktif (biru)
Jika togglenya abu-abu atau kategori AI tidak ada, hubungi administrator akun Anda—fitur AI mungkin memerlukan langganan aktif.
2. Kunci API Dikonfigurasi
Masih di Pengaturan → AI:
- Cari field Kunci API
- Masukkan Kunci API Gemini Anda (lihat Bab 31 untuk cara mendapatkannya)
- Klik Simpan
Tanda centang hijau mengkonfirmasi kunci valid. Peringatan merah berarti kunci salah atau sudah kedaluwarsa.
Catatan: Anda memerlukan koneksi internet aktif selama perekaman. Transkripsi langsung tidak bisa berjalan offline.
Cara Memulai Sesi Transkripsi Langsung
Memulai transkripsi langsung identik dengan memulai perekaman apa pun—tidak ada "mode transkripsi" terpisah yang perlu diaktifkan. Jika Fitur AI aktif dan Kunci API dikonfigurasi, transkripsi langsung diaktifkan secara otomatis.
Langkah demi langkah:
-
Klik tombol rekam merah 🔴 (atau gunakan pintasan keyboard:
Ctrl+Alt+Adi Windows,Cmd+Shift+Adi macOS)- Yang Anda lihat: Tombol berdenyut merah. Timer perekaman mulai menghitung.
-
Perhatikan panel Transkrip muncul
- Yang Anda lihat: Panel meluncur ke tampilan di sisi kanan jendela utama (atau di bawah pemutar, tergantung tata letak Anda). Menampilkan "Connecting…" sebentar.
-
Bicara seperti biasa
- Yang Anda lihat: Setelah 2–5 detik, teks mulai muncul. Frasa terbaru menampilkan animasi halus saat masih diproses.
-
Lanjutkan rapat atau perekaman seperti biasa
- Yang Anda lihat: Segmen yang selesai bertumpuk secara kronologis, masing-masing ditandai dengan label pembicara dan stempel waktu.
-
Hentikan perekaman saat selesai
- Yang Anda lihat: Tombol kembali ke status idle. Pemberitahuan "Saving transcript…" muncul sebentar, lalu menghilang. Transkrip disimpan.
Yang Anda Lihat Saat Merekam
Panel transkrip memiliki tiga area utama:
┌─────────────────────────────────────────────┐
│ Transkrip 🟢 Terhubung │
├─────────────────────────────────────────────┤
│ Speaker 1 0:00:12 │
│ "Good morning everyone, let's get started" │
│ │
│ Speaker 2 0:00:24 │
│ "Thanks for joining on short notice" │
│ │
│ Speaker 1 0:00:31 │
│ "Of course. First item on the agenda…" │
├─────────────────────────────────────────────┤
│ Now Speaking… ████████░░░░ │
│ "…is the Q3 budget review" │
└─────────────────────────────────────────────┘
Arti setiap elemen:
| Elemen | Arti |
|---|---|
| Label pembicara | Siapa yang berbicara — ditetapkan secara otomatis ("Speaker 1", "Speaker 2") |
| Stempel waktu | Kapan dalam rekaman segmen ini dimulai (jam:menit:detik) |
| Teks selesai | Kata-kata yang sudah selesai — ini tidak berubah |
| Pratinjau "Now Speaking…" | Ucapan saat ini yang masih diproses — mungkin sedikit berubah |
| Indikator status | 🟢 Terhubung · 🟡 Menghubungkan · 🔴 Error |
Indikator Status Koneksi
Indikator di sudut kanan atas panel memberi tahu Anda apakah mesin AI dapat dijangkau:
- 🟢 Terhubung — Transkripsi berjalan normal
- 🟡 Menghubungkan — Membuat koneksi (normal saat startup, membutuhkan 2–5 detik)
- 🔴 Error — Koneksi terputus (lihat Pemecahan Masalah di bawah)
Jika Anda melihat 🔴 Error, perekaman itu sendiri terus berlanjut dengan aman—hanya transkripsi langsung yang terpengaruh.
Deteksi Pembicara Otomatis
Mesin AI berusaha membedakan suara yang berbeda dan menetapkan label pada masing-masing.
Cara kerjanya:
Timeline perekaman:
0:00 ──────────────────────────────────────────────────► waktu
│ │ │ │
Speaker 1 Speaker 2 Speaker 1 Speaker 2
"Morning" "Hello" "Agenda…" "Agreed"
▼ ▼ ▼ ▼
[Seg. 1] [Seg. 2] [Seg. 3] [Seg. 4]
Setiap kali pembicara berubah, sistem membuat segmen baru. Segmen dari pembicara yang sama mendapat label yang sama.
Label awal: Pembicara pertama yang berbicara adalah "Speaker 1", suara baru kedua adalah "Speaker 2", dan seterusnya. Ini adalah placeholder—Anda bisa mengganti namanya nanti (lihat Bab 29).
Penyempurnaan pembicara: Seiring perekaman berlanjut, AI mungkin menyempurnakan penetapan sebelumnya jika menjadi yakin bahwa dua segmen milik suara yang sama. Ini normal. Teks tidak berubah—hanya atribusi pembicara pada segmen sebelumnya.
Tips: Untuk pemisahan pembicara yang paling akurat, gunakan headphone daripada speaker. Output speaker yang ditangkap oleh mikrofon Anda bisa membingungkan detektor.
Setelah Perekaman Berhenti
Saat Anda klik stop:
- Pratinjau "Now Speaking…" menyelesaikan kalimat yang sedang diproses
- Transkrip lengkap disimpan bersama file rekaman Anda secara otomatis
- Tidak diperlukan tindakan manual
Di mana menemukan transkrip:
- Buka rekaman di Perpustakaan Perekaman Anda
- Klik AI Insights di panel detail
- Pilih tab Transcript
Transkrip juga tersedia untuk diekspor sebagai SRT (format subtitle) atau JSON dari tab AI Insights. Lihat Bab 28 untuk detail ekspor.
Keterbatasan
Memahami keterbatasan ini membantu menetapkan ekspektasi yang realistis:
| Keterbatasan | Detail |
|---|---|
| Memerlukan internet | Transkripsi langsung tidak bisa berjalan offline. Audio diproses oleh mesin AI melalui jaringan. |
| Akurasi stempel waktu | Stempel waktu bersifat perkiraan (±3 detik). Gunakan untuk navigasi, bukan dokumentasi hukum. |
| Jeda dalam perekaman | Jika Anda menjeda perekaman, transkripsi juga berhenti. Segmen yang dijeda tidak ditranskripsikan. |
| Akurasi bervariasi | Akurasi tertinggi dengan ucapan yang jelas, satu pembicara sekaligus, dan mikrofon yang baik. Aksen yang kuat, kebisingan latar belakang, atau pembicaraan bersamaan mengurangi akurasi. |
| Bahasa | Bahasa transkripsi bisa diatur ke Auto Detect (direkomendasikan) atau bahasa tertentu di Pengaturan → AI → SeaMeet Integration. Auto Detect menangani rapat multibahasa secara otomatis. |
| Tidak ada pengeditan real time | Anda tidak bisa mengedit transkrip saat merekam. Pengeditan tersedia setelah perekaman berhenti. |
Overlay Keterangan Saat Putar Ulang
Saat Anda memutar ulang rekaman yang memiliki transkrip langsung, SeaMeet bisa menampilkan keterangan langsung pada video — seperti closed caption di TV.
Cara keterangan bekerja:
- Teks keterangan ditampilkan pada pratinjau video di bagian bawah frame
- Setiap segmen menampilkan nama pembicara (dikode warna per pembicara) dan teks yang diucapkan
- Keterangan disinkronkan ke posisi putar ulang — maju seiring rekaman diputar
- Keterangan secara otomatis menggunakan transkrip Gemini Live dari sesi tersebut
Warna pembicara: Setiap pembicara diberi warna yang konsisten di semua keterangan dan panel transkrip. Warna ditentukan secara otomatis dan tetap konsisten sepanjang rekaman.
Format keterangan:
[Speaker 1]: Good morning everyone, let's get started.
Keterangan muncul dan menghilang saat segmen transkrip yang cocok diputar.
Tata Letak Video Dua Kolom
Saat menonton rekaman video dengan transkrip langsung yang tersedia, SeaMeet menggunakan tata letak dua kolom:
┌─────────────────────────────────────────────────────┐
│ Pratinjau Video │ Panel Transkrip │
│ │ │
│ [video dengan keterangan] │ Speaker 1 0:00:12 │
│ │ "Good morning..." │
│ │ │
│ │ Speaker 2 0:00:24 │
│ │ "Thanks for joining" │
│ │ [⤢ Max] │
└─────────────────────────────────────────────────────┘
- Kolom kiri: Video lebar tetap dengan overlay keterangan
- Kolom kanan: Panel transkrip yang bisa digulir, disinkronkan ke posisi putar ulang
- Tombol Maksimalkan (⤢): Memperluas panel transkrip ke overlay layar penuh untuk bacaan yang lebih mudah selama rekaman panjang
Tata letak dua kolom hanya muncul untuk rekaman video dengan transkrip langsung. Rekaman hanya audio dan rekaman tanpa transkrip menggunakan tata letak satu kolom standar.
Pengaturan Bahasa untuk Transkripsi
Anda bisa mengkonfigurasi bahasa mana yang diharapkan SeaMeet selama transkripsi langsung:
- Buka Pengaturan (⚙️)
- Navigasikan ke AI → SeaMeet Integration
- Temukan selektor Meeting Language
- Pilih bahasa Anda:
- Auto Detect (default, direkomendasikan) — SeaMeet secara otomatis mengidentifikasi bahasa yang diucapkan. Terbaik untuk rapat multibahasa atau ketika bahasa bervariasi.
- Pilihan manual — Pilih dari 20+ bahasa tertentu termasuk Inggris (AS/UK), Spanyol, Prancis, Jerman, Jepang, Mandarin, Kanton, Korea, dan lainnya.
Tips: Biarkan bahasa diatur ke Auto Detect kecuali Anda memiliki alasan khusus untuk memaksakan bahasa. Deteksi otomatis menangani aksen dan rapat dengan bahasa campuran lebih baik daripada pengaturan yang dipaksakan secara manual.
Pemecahan Masalah
"Panel transkrip tidak muncul"
Gejala: Anda mulai merekam tetapi panel transkrip tidak pernah muncul.
Periksa ini secara berurutan:
- Pergi ke Pengaturan → AI dan konfirmasi toggle Fitur AI aktif
- Konfirmasi Kunci API Anda valid (tanda centang hijau di Pengaturan → AI)
- Periksa koneksi internet Anda — coba muat halaman web
- Restart SeaMeet dan coba lagi
Jika panel masih tidak muncul setelah keempat langkah, layanan AI mungkin sementara tidak tersedia. Perekaman itu sendiri tidak terpengaruh—coba lagi nanti.
"Koneksi terputus di tengah perekaman"
Gejala: Indikator status berubah menjadi 🔴 merah selama perekaman.
Yang terjadi: Koneksi ke mesin AI terputus. Ini bisa terjadi karena:
- Gangguan jaringan sementara
- Wi-Fi beralih access point
- Layanan AI sementara offline
Yang harus dilakukan:
- Jangan hentikan perekaman—itu terus berlanjut dengan aman
- Periksa koneksi internet Anda
- Koneksi biasanya pulih secara otomatis dalam 30 detik
- Kata-kata yang diucapkan selama periode pemutusan tidak dipulihkan—hilang untuk transkrip langsung (tetapi audio tetap ada dalam file rekaman, sehingga Anda bisa menjalankan AI Extraction setelahnya — lihat Bab 28)
"Pembicara tidak dilabeli dengan benar"
Gejala: Beberapa orang dilabeli sebagai "Speaker 1", atau satu orang muncul sebagai dua pembicara yang berbeda.
Yang terjadi: Deteksi pembicara menggunakan karakteristik suara. Akurasi menurun ketika:
- Beberapa orang berbicara pada waktu yang sama
- Suara pembicara berubah secara signifikan (tertawa, suara tinggi, audio buruk)
- Kebisingan latar belakang mengganggu
Yang harus dilakukan:
- Setelah perekaman, ganti nama pembicara di panel Speakers (lihat Bab 29)
- Gunakan fitur Merge untuk menggabungkan dua label yang milik orang yang sama (Bab 29)
Praktik Terbaik
Ikuti praktik ini untuk hasil transkripsi langsung terbaik:
Satu pembicara pada satu waktu Pembicaraan bersamaan (dua orang berbicara bersamaan) membingungkan deteksi pembicara dan menghasilkan teks yang kacau dalam transkrip. Dorong peserta untuk bergiliran.
Lingkungan perekaman yang tenang Kebisingan latar belakang—sistem HVAC, pengetikan, kebisingan jalanan—ditangkap oleh mikrofon dan mengurangi akurasi transkripsi. Mikrofon headset yang ditempatkan dekat mulut memberikan hasil yang jauh lebih baik daripada mikrofon laptop bawaan.
Penempatan mikrofon yang baik Untuk rapat tatap muka dengan beberapa peserta, tempatkan mikrofon di dekat pusat meja, atau gunakan mikrofon individual untuk setiap peserta.
Koneksi internet yang stabil Gunakan koneksi berkabel atau sinyal Wi-Fi yang kuat. Hindari hotspot atau jaringan dengan kehilangan paket tinggi—mereka menyebabkan putusnya koneksi.
Ganti nama pembicara segera Lakukan penggantian nama pembicara segera setelah perekaman saat Anda masih ingat siapa yang mengatakan apa. Lihat Bab 29 untuk instruksi.
Referensi Cepat
┌────────────────────────────────────────────────────────────┐
│ TRANSKRIPSI LANGSUNG │
│ Referensi Cepat │
├────────────────────────────────────────────────────────────┤
│ Mulai │ Rekam seperti biasa — aktif otomatis │
│ Status: hijau │ 🟢 Transkripsi berjalan │
│ Status: kuning │ 🟡 Menghubungkan (tunggu 5 d) │
│ Status: merah │ 🔴 Terputus — perekaman aman │
├────────────────────────────────────────────────────────────┤
│ Panel transkrip │ Sisi kanan jendela utama │
│ Baris pratinjau │ "Now Speaking…" — sedang diproses │
│ Baris selesai │ Final — tidak akan berubah │
├────────────────────────────────────────────────────────────┤
│ Setelah berhenti │ Transkrip disimpan otomatis │
│ Temukan di │ Rekaman → AI Insights → Transcript │
├────────────────────────────────────────────────────────────┤
│ Memerlukan │ Internet + Fitur AI aktif + Kunci API │
│ Stempel waktu │ Perkiraan ±3 detik │
│ Jeda │ Tidak ditranskripsikan │
└────────────────────────────────────────────────────────────┘
Last updated: 2026-03-20
← Chapter 26: Glossary of Terms | Chapter 28: AI Extraction →
Published: