Транскрипция в реальном времени — слова на экране по мере вашей речи
Глава 27: Транскрипция в реальном времени — слова на экране по мере вашей речи
Представьте стенографиста, который печатает по ходу заседания — каждое слово фиксируется в момент его произнесения, без ожидания окончания встречи. Именно это делает транскрипция в реальном времени SeaMeet для ваших записей. Пока вы говорите, панель транскрипта заполняется в реальном времени: метки спикеров, временные метки и сами слова — всё появляется по ходу разговора.
Никакого ожидания. Никакого шага загрузки. Просто слова на экране.
Цели главы
После прочтения этой главы вы сможете:
- Понять, что такое транскрипция в реальном времени и когда её использовать
- Настроить необходимые условия перед началом
- Начать сессию записи с активной транскрипцией в реальном времени
- Читать и интерпретировать панель транскрипта во время записи
- Понять, как работает автоматическое определение спикеров
- Устранять наиболее распространённые проблемы с подключением и отображением
Что такое транскрипция в реальном времени?
Транскрипция в реальном времени преобразует аудио из вашей записи в текст во время записи, создавая транскрипт с временными метками и метками спикеров в режиме реального времени.
Думайте об этом так: представьте машинистку, сидящую рядом с вами на каждой встрече, мгновенно записывающую всё сказанное — с указанием принадлежности каждого слова и точного времени произнесения. Этот транскрипт доступен сразу после окончания встречи. Никакой задержки транскрипции. Никакого крутящегося индикатора "Обработка аудио".
Транскрипция в реальном времени работает параллельно с вашей сессией записи. С момента начала записи:
- Механизм ИИ начинает прослушивание
- Слова появляются в панели транскрипта в течение нескольких секунд после произнесения
- Метки спикеров ("Спикер 1", "Спикер 2") присваиваются автоматически
- Временные метки обозначают место каждого сегмента в записи
По остановке записи полный транскрипт автоматически сохраняется вместе с аудио/видеофайлом.
Перед началом
Для транскрипции в реальном времени необходимо настроить два условия перед первой сессией:
1. Функции ИИ включены
- Откройте Настройки (значок шестерёнки ⚙️ в правом верхнем углу)
- Перейдите в категорию ИИ
- Убедитесь, что переключатель Функции ИИ установлен вкл (синий)
Если переключатель серый или категория ИИ отсутствует, обратитесь к администратору вашего аккаунта — для функций ИИ мо жет потребоваться активная подписка.
2. Настроен API-ключ
Оставаясь в Настройки → ИИ:
- Найдите поле API-ключ
- Введите ваш API-ключ Gemini (см. Главу 31 для получения)
- Нажмите Сохранить
Зелёная галочка подтверждает правильность ключа. Красное предупреждение означает, что ключ неверный или просрочен.
Примечание: Во время записи требуется активное подключение к интернету. Транскрипция в реальном времени не может работать офлайн.
Как начать сессию транскрипции в реальном времени
Начало транскрипции в реальном времени идентично запуску любой записи — нет отдельного "режима транскрипции" для включения. Если Функции ИИ включены и API-ключ настроен, транскрипция в реальном времени активируется автоматически.
Пошагово:
-
Нажмите красную кнопку записи 🔴 (или используйте горячую клавишу:
Ctrl+Alt+Aна Windows,Cmd+Shift+Aна macOS)- Что вы видите: Кнопка пульсирует красным. Таймер записи начинает отсчёт.
-
Смотрите, как появляется панель транскрипта
- Что вы видите: Панель выдвигается с правой стороны главного окна (или под плеером, в зависимости от вашего расположения). Кратко отображается "Подключение...".
-
Говорите как обычно
- Что вы видите: Через 2–5 секунд начинает появляться текст. Последняя фраза показывает лёгкую анимацию, пока ещё обрабатывается.
-
Продолжайте встречу или запись как обычно
- Что вы видите: Завершённые сегменты накапливаются в хронологическом порядке, каждый помечен меткой спикера и временной меткой.
-
Остановите запись по окончании
- Что вы видите: Кнопка возвращается в состояние покоя. Кратко мигает уведомление "Сохранение транскрипта...", затем исчезает. Транскрипт сохранён.
Что вы видите во время записи
Панель транскрипта имеет три основные области:
┌─────────────────────────────────────────────┐
│ Транскрипт 🟢 Подключено │
├─────────────────────────────────────────────┤
│ Спикер 1 0:00:12 │
│ "Доброе утро всем, давайте начнём" │
│ │
│ Спикер 2 0:00:24 │
│ "Спасибо, что присоединились так быстро" │
│ │
│ Спикер 1 0:00:31 │
│ "Конечно. Первый пункт повестки дня…" │
├─────────────────────────────────────────────┤
│ Говорит сейчас… ████████░░░░ │
│ "…это обзор бюджета за Q3" │
└─────────────────────────────────────────────┘
Значение каждого элемента:
| Элемент | Значение |
|---|---|
| Метка спикера | Кто говорит — присваивается автоматически ("Спикер 1", "Спикер 2") |
| Временная метка | Когда в записи начинается этот сегмент (часы:минуты:секунды) |
| Завершённый текст | Финализированные слова — они не изменятся |
| Предпросмотр "Говорит сейчас..." | Текущее высказывание ещё обрабатывается — может немного измениться |
| Индикатор статуса | 🟢 Подключено · 🟡 Подключение · 🔴 Ошибка |
Индикатор статуса подключения
Индикатор в правом верхнем углу панели показывает, доступен ли механизм ИИ:
- 🟢 Подключено — транскрипция работает нормально
- 🟡 Подключение — устанавливается соединение (норма при запуске, занимает 2–5 секунд)
- 🔴 Ошибка — соединение потеряно (см. раздел "Устранение неполадок" ниже)
Если отображается 🔴 Ошибка, сама запись продолжается без проблем — затронута только транскрипция в реальном времени.
Автоматическое определение спикеров
Механизм ИИ пытается различить разные голоса и присвоить каждому метку.
Как это работает:
Временная шкала записи:
0:00 ──────────────────────────────────────────────────► время
│ │ │ │
Спикер 1 Спикер 2 Спикер 1 Спикер 2
"Утро" "Привет" "Повестка…" "Согласен"
▼ ▼ ▼ ▼
[Сег. 1] [Сег. 2] [Сег. 3] [Сег. 4]
Каждый раз при смене спикера система создаёт новый сегмент. Сегменты одного спикера получают одинаковую метку.
Начальные метки: Первый говорящий становится "Спикером 1", второй новый голос — "Спикером 2" и т.д. Это временные метки — их можно переименовать позже (см. Главу 29).
Уточнение спикеров: По мере записи ИИ может уточнять ранее сделанные назначения, если становится уверен, что два сегмента принадлежат одному голосу. Это нормально. Текст не изменяется — меняется только атрибуция спикера для прошлых сегментов.
Совет: Для наиболее точного разделения спикеров используйте наушники, а не динамики. Звук динамиков, уловленный вашим микрофоном, может запутать детектор.
После остановки записи
Когда вы нажимаете стоп:
- Предпросмотр "Говорит сейчас..." финализирует любое незавершённое предложение
- Полный транскрипт автоматически сохраняется вместе с файлом записи
- Никаких ручных действий не требуется
Где найти транскрипт:
- Откройте запись в Библиотеке записей
- Нажмите Insights ИИ на панели деталей
- Выберите вкладку Транскрипт
Транскрипт также доступен для экспорта в формате SRT (формат субтитров) или JSON со вкладки Insights ИИ. Подробности экспорта в Главе 28.
Ограничения
Понимание этих ограничений помогает формировать реалистичные ожидания:
| Ограничение | Подробности |
|---|---|
| Требуется интернет | Транскрипция в реальном времени не работает офлайн. Аудио обрабатывается механизмом ИИ по сети. |
| Точность временных меток | Временные метки приблизительны (±3 секунды). Используйте их для навигации, а не для юридической документации. |
| Паузы в записи | При паузе записи транскрипция тоже приостанавливается. Паузированные сегменты не транскрибируются. |
| Точность варьируется | Точность наиболее высокая при чёткой речи, одном говорящем одновременно и хорошем микрофоне. Сильные акценты, фоновый шум или перебивание снижают точность. |
| Язык | Язык транскрипции можно установить на Авто-определение (рекомендуется) или конкретный язык в Настройки → ИИ → SeaMeet Integration. Авто-определение автоматически обрабатывает многоязычные встречи. |
| Нет редактирования в реальном времени | Нельзя редактировать транскрипт во время записи. Редактирование доступно после остановки записи. |
Наложение субтитров при воспроизведении
При воспроизведении записи с транскриптом в реальном времени SeaMeet может отображать субтитры прямо на видео — как закрытые субтитры на телевизоре.
Как работают субтитры:
- Текст субтитров накладывается на предпросмотр видео внизу кадра
- Каждый сегмент показывает имя спикера (с цветовой кодировкой по спикеру) и произнесённый текст
- Субтитры синхронизированы с позицией воспроизведения — они продвигаются по мере воспроизведения записи
- Субтитры автоматически используют транскрипт Gemini Live из сессии
Цвета спикеров: Каждому спикеру присваивается постоянный цвет во всех субтитрах и панелях транскрипта. Цвета определяются автоматически и остаются неизменными на протяжении всей записи.
Формат субтитров:
[Спикер 1]: Доброе утро всем, давайте начнём.
Субтитры появляются и исчезают по мере воспроизведения соответствующего сегмента транскрипта.
Двухколонный видеомакет
При просмотре видеозаписи с доступным транскриптом в реальном времени SeaMeet использует двухколонный макет:
┌─────────────────────────────────────────────────────┐
│ Предпросмотр видео │ Панель транскрипта │
│ │ │
│ [видео с субтитрами] │ Спикер 1 0:00:12 │
│ │ "Доброе утро..." │
│ │ │
│ │ Спикер 2 0:00:24 │
│ │ "Спасибо за у частие" │
│ │ [⤢ Макс] │
└─────────────────────────────────────────────────────┘
- Левая колонка: Видео фиксированной ширины с наложением субтитров
- Правая колонка: Прокручиваемая панель транскрипта, синхронизированная с позицией воспроизведения
- Кнопка "Развернуть" (⤢): Разворачивает панель транскрипта во весь экран для удобного чтения длинных записей
Двухколонный макет отображается только для видеозаписей с транскриптами в реальном времени. Записи только аудио и записи без транскриптов используют стандартный одноколонный макет.
Настройки языка транскрипции
Вы можете настроить, какой язык SeaMeet ожидает при транскрипции в реальном времени:
- Откройте Настройки (⚙️)
- Перейдите в ИИ → SeaMeet Integration
- Найдите селектор Язык встречи
- Выберите язык:
- Авто-определение (по умолчанию, рекомендуется) — SeaMeet автоматически определяет язык речи. Лучший вариант для многоязычных встреч или когда язык варьируется.
- Ручной выбор — выберите из 20+ конкретных языков, включая русский, английский (США/Великобритания), испанский, французский, немецкий, японский, мандаринский, кантонский, корейский и другие.
Совет: Оставьте язык на Авто-определении, если нет конкретной причины принудительно задать язык. Авто-определение лучше справляется с акцентами и смешанноязычными встречами, чем принудительно заданная настройка.
Устранение неполадок
"Панель транскрипта не появляется"
Симптом: Вы начинаете запись, но панель транскрипта так и не появляется.
Проверьте по порядку:
- Пере йдите в Настройки → ИИ и убедитесь, что переключатель Функции ИИ включён
- Убедитесь, что ваш API-ключ действителен (зелёная галочка в Настройки → ИИ)
- Проверьте подключение к интернету — попробуйте открыть веб-страницу
- Перезапустите SeaMeet и попробуйте снова
Если панель всё ещё не появляется после всех четырёх шагов, служба ИИ может быть временно недоступна. Сама запись не затронута — попробуйте позже.
"Соединение прервалось в середине записи"
Симптом: Индикатор статуса становится 🔴 красным во время записи.
Что произошло: Соединение с механизмом ИИ было прервано. Это может произойти из-за:
- Временного прерывания сети
- Переключения Wi-Fi между точками доступа
- Кратковременного отключения службы ИИ
Что делать:
- Не останавливайте запись — она продолжается безопасно
- Проверьте подключение к интернету
- Соединение обычно восстанавливается автоматически в течение 30 секунд
- Слова, произнесённые в период отключения, не восстанавливаются — они потеряны для транскрипта в реальном времени (но аудио остаётся в файле записи, поэтому вы можете запустить Извлечение ИИ постфактум — см. Главу 28)
"Спикеры определены неверно"
Симптом: Несколько человек помечены как "Спикер 1", или один человек появляется как два разных спикера.
Что происходит: Определение спикеров использует голосовые характеристики. Точность снижается при:
- Одновременном разговоре нескольких людей
- Значительном изменении голоса спикера (смех, повышенный голос, плохое аудио)
- Помехах фонового шума
Что делать:
- После записи переименуйте спикеров на панели Спикеров (см. Главу 29)
- Используйте функцию Объединить для слияния двух меток, принадлежащих одному человеку (Глава 29)
Лучшие практики
Следуйте этим практикам для наилучших результатов транскрипции в реальном времени:
Один спикер за раз Перебивание (когда двое говорят одновременно) запутывает определение спикеров и создаёт несвязный текст в транскрипте. Поощряйте участников говорить по очереди.
Тихая среда записи Фоновый шум — системы кондиционирования, печатание, уличный шум — улавливается микрофоном и снижает точность транскрипции. Гарнитурный микрофон, расположенный близко к губам, даёт значительно лучшие результаты, чем встроенный микрофон ноутбука.
Правильное расположение микрофона На очных встречах с несколькими участниками располагайте микрофон ближе к центру стола или используйте индивидуальные микрофоны для каждого участника.
Стабильное подключение к интернету Используйте проводное соединение или сильный сигнал Wi-Fi. Избегайте мобильных точек доступа или сетей с высокими потерями пакетов — они вызывают разрывы соединения.
Переименовывайте спикеров своевременно Делайте переименование спикеров сразу после записи, пока вы помните, кто что говорил. Инструкции в Главе 29.
Краткий справочник
┌────────────────────────────────────────────────────────────┐
│ ТРАНСКРИПЦИЯ В РЕАЛЬНОМ ВРЕМЕНИ │
│ Краткий справочник │
├────────────────────────────────────────────────────────────┤
│ Старт │ Записывайте как обычно — авто-активация │
│ Статус: зелёный │ 🟢 Транскрипция работает │
│ Статус: жёлтый │ 🟡 Подключение (подождите 5 с) │
│ Статус: красный │ 🔴 Отключено — запись безопасна │
├────────────────────────────────────────────────────────────┤
│ Панель транскр. │ Правая сторона главного окна │
│ Строка предпр. │ "Говорит сейчас..." — в процессе │
│ Завершённые │ Финальные — не изменятся │
├────────────────────────────────────────────────────────────┤
│ После остановки │ Транскрипт сохраняется автоматически │
│ Найти │ Запись → Insights ИИ → Транскрипт │
├────────────────────────────────────────────────────────────┤
│ Требуется │ Интернет + Функции ИИ вкл + API-ключ │
│ Временные метки │ Приблизительно ±3 секунды │
│ Паузы │ Не транскрибируются │
└────────────────────────────────────────────────────────────┘
Last updated: 2026-03-20
Published: