Bab 27: Transkripsi Langsung — Kata-Kata di Layar Saat Anda Berbicara

Bayangkan seorang juru tulis pengadilan yang mengetik saat sesi berlangsung—setiap kata direkam saat diucapkan, tanpa menunggu sampai rapat berakhir. Itulah tepatnya yang dilakukan transkripsi langsung SeaMeet untuk rekaman Anda. Saat Anda berbicara, panel transkrip terisi secara real time: label pembicara, stempel waktu, dan kata-kata yang sebenarnya, semuanya muncul saat percakapan berlangsung.

Tidak perlu menunggu. Tidak ada langkah unggah. Hanya kata-kata di layar.

Tujuan Bab

Setelah membaca bab ini, Anda akan mampu:

Memahami apa yang dilakukan transkripsi langsung dan kapan menggunakannya
Menyiapkan prasyarat sebelum memulai
Memulai sesi perekaman dengan transkripsi langsung aktif
Membaca dan menginterpretasikan panel transkrip saat merekam
Memahami cara kerja deteksi pembicara otomatis
Memecahkan masalah koneksi dan tampilan yang paling umum

Apa Itu Transkripsi Langsung?

Transkripsi langsung mengubah audio dari rekaman Anda menjadi teks saat Anda merekam, menghasilkan transkrip yang diberi stempel waktu dan dilabeli pembicara secara real time.

Anggap seperti ini: Bayangkan seorang juru tik duduk di sebelah Anda di setiap rapat, langsung menuliskan semua yang dikatakan—melabeli kata-kata setiap orang dan mencatat waktu persis mereka berbicara. Transkrip itu tersedia segera setelah rapat berakhir. Tidak ada penundaan transkripsi. Tidak ada spinner "sedang memproses audio Anda".

Transkripsi langsung berjalan bersamaan dengan sesi perekaman Anda. Saat Anda mulai merekam:

Mesin AI mulai mendengarkan
Kata-kata muncul di panel Transkrip dalam beberapa detik setelah diucapkan
Label pembicara ("Speaker 1", "Speaker 2") ditetapkan secara otomatis
Stempel waktu menandai posisi dalam rekaman setiap segmen

Saat Anda berhenti merekam, transkrip lengkap disimpan secara otomatis bersama file audio/video.

Sebelum Anda Mulai

Transkripsi langsung memerlukan dua hal yang dikonfigurasi sebelum sesi pertama Anda:

1. Fitur AI Diaktifkan

Buka Pengaturan (ikon roda gigi ⚙️ di sudut kanan atas)
Navigasikan ke kategori AI
Konfirmasi toggle Fitur AI aktif (biru)

Jika togglenya abu-abu atau kategori AI tidak ada, hubungi administrator akun Anda—fitur AI mungkin memerlukan langganan aktif.

2. Kunci API Dikonfigurasi

Masih di Pengaturan → AI:

Cari field Kunci API
Masukkan Kunci API Gemini Anda (lihat Bab 31 untuk cara mendapatkannya)
Klik Simpan

Tanda centang hijau mengkonfirmasi kunci valid. Peringatan merah berarti kunci salah atau sudah kedaluwarsa.

Catatan: Anda memerlukan koneksi internet aktif selama perekaman. Transkripsi langsung tidak bisa berjalan offline.

Cara Memulai Sesi Transkripsi Langsung

Memulai transkripsi langsung identik dengan memulai perekaman apa pun—tidak ada "mode transkripsi" terpisah yang perlu diaktifkan. Jika Fitur AI aktif dan Kunci API dikonfigurasi, transkripsi langsung diaktifkan secara otomatis.

Langkah demi langkah:

Klik tombol rekam merah 🔴 (atau gunakan pintasan keyboard: Ctrl+Alt+A di Windows, Cmd+Shift+A di macOS)
- Yang Anda lihat: Tombol berdenyut merah. Timer perekaman mulai menghitung.
Perhatikan panel Transkrip muncul
- Yang Anda lihat: Panel meluncur ke tampilan di sisi kanan jendela utama (atau di bawah pemutar, tergantung tata letak Anda). Menampilkan "Connecting…" sebentar.
Bicara seperti biasa
- Yang Anda lihat: Setelah 2–5 detik, teks mulai muncul. Frasa terbaru menampilkan animasi halus saat masih diproses.
Lanjutkan rapat atau perekaman seperti biasa
- Yang Anda lihat: Segmen yang selesai bertumpuk secara kronologis, masing-masing ditandai dengan label pembicara dan stempel waktu.
Hentikan perekaman saat selesai
- Yang Anda lihat: Tombol kembali ke status idle. Pemberitahuan "Saving transcript…" muncul sebentar, lalu menghilang. Transkrip disimpan.

Yang Anda Lihat Saat Merekam

Panel transkrip memiliki tiga area utama:

┌─────────────────────────────────────────────┐
│  Transkrip                     🟢 Terhubung  │
├─────────────────────────────────────────────┤
│  Speaker 1   0:00:12                        │
│  "Good morning everyone, let's get started" │
│                                             │
│  Speaker 2   0:00:24                        │
│  "Thanks for joining on short notice"       │
│                                             │
│  Speaker 1   0:00:31                        │
│  "Of course. First item on the agenda…"    │
├─────────────────────────────────────────────┤
│  Now Speaking…  ████████░░░░                │
│  "…is the Q3 budget review"                 │
└─────────────────────────────────────────────┘

Arti setiap elemen:

Elemen	Arti
Label pembicara	Siapa yang berbicara — ditetapkan secara otomatis ("Speaker 1", "Speaker 2")
Stempel waktu	Kapan dalam rekaman segmen ini dimulai (jam:menit:detik)
Teks selesai	Kata-kata yang sudah selesai — ini tidak berubah
Pratinjau "Now Speaking…"	Ucapan saat ini yang masih diproses — mungkin sedikit berubah
Indikator status	🟢 Terhubung · 🟡 Menghubungkan · 🔴 Error

Indikator Status Koneksi

Indikator di sudut kanan atas panel memberi tahu Anda apakah mesin AI dapat dijangkau:

🟢 Terhubung — Transkripsi berjalan normal
🟡 Menghubungkan — Membuat koneksi (normal saat startup, membutuhkan 2–5 detik)
🔴 Error — Koneksi terputus (lihat Pemecahan Masalah di bawah)

Jika Anda melihat 🔴 Error, perekaman itu sendiri terus berlanjut dengan aman—hanya transkripsi langsung yang terpengaruh.

Deteksi Pembicara Otomatis

Mesin AI berusaha membedakan suara yang berbeda dan menetapkan label pada masing-masing.

Cara kerjanya:

Timeline perekaman:

0:00 ──────────────────────────────────────────────────► waktu
        │           │           │           │
      Speaker 1   Speaker 2   Speaker 1   Speaker 2
      "Morning"   "Hello"     "Agenda…"   "Agreed"
          ▼           ▼           ▼           ▼
      [Seg. 1]    [Seg. 2]    [Seg. 3]    [Seg. 4]

Setiap kali pembicara berubah, sistem membuat segmen baru. Segmen dari pembicara yang sama mendapat label yang sama.

Label awal: Pembicara pertama yang berbicara adalah "Speaker 1", suara baru kedua adalah "Speaker 2", dan seterusnya. Ini adalah placeholder—Anda bisa mengganti namanya nanti (lihat Bab 29).

Penyempurnaan pembicara: Seiring perekaman berlanjut, AI mungkin menyempurnakan penetapan sebelumnya jika menjadi yakin bahwa dua segmen milik suara yang sama. Ini normal. Teks tidak berubah—hanya atribusi pembicara pada segmen sebelumnya.

Tips: Untuk pemisahan pembicara yang paling akurat, gunakan headphone daripada speaker. Output speaker yang ditangkap oleh mikrofon Anda bisa membingungkan detektor.

Setelah Perekaman Berhenti

Saat Anda klik stop:

Pratinjau "Now Speaking…" menyelesaikan kalimat yang sedang diproses
Transkrip lengkap disimpan bersama file rekaman Anda secara otomatis
Tidak diperlukan tindakan manual

Di mana menemukan transkrip:

Buka rekaman di Perpustakaan Perekaman Anda
Klik AI Insights di panel detail
Pilih tab Transcript

Transkrip juga tersedia untuk diekspor sebagai SRT (format subtitle) atau JSON dari tab AI Insights. Lihat Bab 28 untuk detail ekspor.

Keterbatasan

Memahami keterbatasan ini membantu menetapkan ekspektasi yang realistis:

Keterbatasan	Detail
Memerlukan internet	Transkripsi langsung tidak bisa berjalan offline. Audio diproses oleh mesin AI melalui jaringan.
Akurasi stempel waktu	Stempel waktu bersifat perkiraan (±3 detik). Gunakan untuk navigasi, bukan dokumentasi hukum.
Jeda dalam perekaman	Jika Anda menjeda perekaman, transkripsi juga berhenti. Segmen yang dijeda tidak ditranskripsikan.
Akurasi bervariasi	Akurasi tertinggi dengan ucapan yang jelas, satu pembicara sekaligus, dan mikrofon yang baik. Aksen yang kuat, kebisingan latar belakang, atau pembicaraan bersamaan mengurangi akurasi.
Bahasa	Bahasa transkripsi bisa diatur ke Auto Detect (direkomendasikan) atau bahasa tertentu di Pengaturan → AI → SeaMeet Integration. Auto Detect menangani rapat multibahasa secara otomatis.
Tidak ada pengeditan real time	Anda tidak bisa mengedit transkrip saat merekam. Pengeditan tersedia setelah perekaman berhenti.

Overlay Keterangan Saat Putar Ulang

Saat Anda memutar ulang rekaman yang memiliki transkrip langsung, SeaMeet bisa menampilkan keterangan langsung pada video — seperti closed caption di TV.

Cara keterangan bekerja:

Teks keterangan ditampilkan pada pratinjau video di bagian bawah frame
Setiap segmen menampilkan nama pembicara (dikode warna per pembicara) dan teks yang diucapkan
Keterangan disinkronkan ke posisi putar ulang — maju seiring rekaman diputar
Keterangan secara otomatis menggunakan transkrip Gemini Live dari sesi tersebut

Warna pembicara: Setiap pembicara diberi warna yang konsisten di semua keterangan dan panel transkrip. Warna ditentukan secara otomatis dan tetap konsisten sepanjang rekaman.

Format keterangan:

[Speaker 1]: Good morning everyone, let's get started.

Keterangan muncul dan menghilang saat segmen transkrip yang cocok diputar.

Tata Letak Video Dua Kolom

Saat menonton rekaman video dengan transkrip langsung yang tersedia, SeaMeet menggunakan tata letak dua kolom:

┌─────────────────────────────────────────────────────┐
│  Pratinjau Video           │  Panel Transkrip        │
│                            │                         │
│  [video dengan keterangan] │  Speaker 1   0:00:12   │
│                            │  "Good morning..."     │
│                            │                         │
│                            │  Speaker 2   0:00:24   │
│                            │  "Thanks for joining"  │
│                            │              [⤢ Max]   │
└─────────────────────────────────────────────────────┘

Kolom kiri: Video lebar tetap dengan overlay keterangan
Kolom kanan: Panel transkrip yang bisa digulir, disinkronkan ke posisi putar ulang
Tombol Maksimalkan (⤢): Memperluas panel transkrip ke overlay layar penuh untuk bacaan yang lebih mudah selama rekaman panjang

Tata letak dua kolom hanya muncul untuk rekaman video dengan transkrip langsung. Rekaman hanya audio dan rekaman tanpa transkrip menggunakan tata letak satu kolom standar.

Pengaturan Bahasa untuk Transkripsi

Anda bisa mengkonfigurasi bahasa mana yang diharapkan SeaMeet selama transkripsi langsung:

Buka Pengaturan (⚙️)
Navigasikan ke AI → SeaMeet Integration
Temukan selektor Meeting Language
Pilih bahasa Anda:
- Auto Detect (default, direkomendasikan) — SeaMeet secara otomatis mengidentifikasi bahasa yang diucapkan. Terbaik untuk rapat multibahasa atau ketika bahasa bervariasi.
- Pilihan manual — Pilih dari 20+ bahasa tertentu termasuk Inggris (AS/UK), Spanyol, Prancis, Jerman, Jepang, Mandarin, Kanton, Korea, dan lainnya.

Tips: Biarkan bahasa diatur ke Auto Detect kecuali Anda memiliki alasan khusus untuk memaksakan bahasa. Deteksi otomatis menangani aksen dan rapat dengan bahasa campuran lebih baik daripada pengaturan yang dipaksakan secara manual.

Pemecahan Masalah

"Panel transkrip tidak muncul"

Gejala: Anda mulai merekam tetapi panel transkrip tidak pernah muncul.

Periksa ini secara berurutan:

Pergi ke Pengaturan → AI dan konfirmasi toggle Fitur AI aktif
Konfirmasi Kunci API Anda valid (tanda centang hijau di Pengaturan → AI)
Periksa koneksi internet Anda — coba muat halaman web
Restart SeaMeet dan coba lagi

Jika panel masih tidak muncul setelah keempat langkah, layanan AI mungkin sementara tidak tersedia. Perekaman itu sendiri tidak terpengaruh—coba lagi nanti.

"Koneksi terputus di tengah perekaman"

Gejala: Indikator status berubah menjadi 🔴 merah selama perekaman.

Yang terjadi: Koneksi ke mesin AI terputus. Ini bisa terjadi karena:

Gangguan jaringan sementara
Wi-Fi beralih access point
Layanan AI sementara offline

Yang harus dilakukan:

Jangan hentikan perekaman—itu terus berlanjut dengan aman
Periksa koneksi internet Anda
Koneksi biasanya pulih secara otomatis dalam 30 detik
Kata-kata yang diucapkan selama periode pemutusan tidak dipulihkan—hilang untuk transkrip langsung (tetapi audio tetap ada dalam file rekaman, sehingga Anda bisa menjalankan AI Extraction setelahnya — lihat Bab 28)

"Pembicara tidak dilabeli dengan benar"

Gejala: Beberapa orang dilabeli sebagai "Speaker 1", atau satu orang muncul sebagai dua pembicara yang berbeda.

Yang terjadi: Deteksi pembicara menggunakan karakteristik suara. Akurasi menurun ketika:

Beberapa orang berbicara pada waktu yang sama
Suara pembicara berubah secara signifikan (tertawa, suara tinggi, audio buruk)
Kebisingan latar belakang mengganggu

Yang harus dilakukan:

Setelah perekaman, ganti nama pembicara di panel Speakers (lihat Bab 29)
Gunakan fitur Merge untuk menggabungkan dua label yang milik orang yang sama (Bab 29)

Praktik Terbaik

Ikuti praktik ini untuk hasil transkripsi langsung terbaik:

Satu pembicara pada satu waktu Pembicaraan bersamaan (dua orang berbicara bersamaan) membingungkan deteksi pembicara dan menghasilkan teks yang kacau dalam transkrip. Dorong peserta untuk bergiliran.

Lingkungan perekaman yang tenang Kebisingan latar belakang—sistem HVAC, pengetikan, kebisingan jalanan—ditangkap oleh mikrofon dan mengurangi akurasi transkripsi. Mikrofon headset yang ditempatkan dekat mulut memberikan hasil yang jauh lebih baik daripada mikrofon laptop bawaan.

Penempatan mikrofon yang baik Untuk rapat tatap muka dengan beberapa peserta, tempatkan mikrofon di dekat pusat meja, atau gunakan mikrofon individual untuk setiap peserta.

Koneksi internet yang stabil Gunakan koneksi berkabel atau sinyal Wi-Fi yang kuat. Hindari hotspot atau jaringan dengan kehilangan paket tinggi—mereka menyebabkan putusnya koneksi.

Ganti nama pembicara segera Lakukan penggantian nama pembicara segera setelah perekaman saat Anda masih ingat siapa yang mengatakan apa. Lihat Bab 29 untuk instruksi.

Referensi Cepat

┌────────────────────────────────────────────────────────────┐
│                  TRANSKRIPSI LANGSUNG                      │
│                   Referensi Cepat                          │
├────────────────────────────────────────────────────────────┤
│  Mulai             │ Rekam seperti biasa — aktif otomatis  │
│  Status: hijau     │ 🟢 Transkripsi berjalan               │
│  Status: kuning    │ 🟡 Menghubungkan (tunggu 5 d)         │
│  Status: merah     │ 🔴 Terputus — perekaman aman          │
├────────────────────────────────────────────────────────────┤
│  Panel transkrip   │ Sisi kanan jendela utama              │
│  Baris pratinjau   │ "Now Speaking…" — sedang diproses     │
│  Baris selesai     │ Final — tidak akan berubah            │
├────────────────────────────────────────────────────────────┤
│  Setelah berhenti  │ Transkrip disimpan otomatis           │
│  Temukan di        │ Rekaman → AI Insights → Transcript    │
├────────────────────────────────────────────────────────────┤
│  Memerlukan        │ Internet + Fitur AI aktif + Kunci API │
│  Stempel waktu     │ Perkiraan ±3 detik                    │
│  Jeda              │ Tidak ditranskripsikan                │
└────────────────────────────────────────────────────────────┘

Last updated: 2026-03-20

← Chapter 26: Glossary of Terms | Chapter 28: AI Extraction →

Transkripsi Langsung - Kata-Kata di Layar Saat Anda Berbicara