Глава 27: Транскрипция в реальном времени — слова на экране по мере вашей речи

Представьте стенографиста, который печатает по ходу заседания — каждое слово фиксируется в момент его произнесения, без ожидания окончания встречи. Именно это делает транскрипция в реальном времени SeaMeet для ваших записей. Пока вы говорите, панель транскрипта заполняется в реальном времени: метки спикеров, временные метки и сами слова — всё появляется по ходу разговора.

Никакого ожидания. Никакого шага загрузки. Просто слова на экране.

Цели главы

После прочтения этой главы вы сможете:

Понять, что такое транскрипция в реальном времени и когда её использовать
Настроить необходимые условия перед началом
Начать сессию записи с активной транскрипцией в реальном времени
Читать и интерпретировать панель транскрипта во время записи
Понять, как работает автоматическое определение спикеров
Устранять наиболее распространённые проблемы с подключением и отображением

Что такое транскрипция в реальном времени?

Транскрипция в реальном времени преобразует аудио из вашей записи в текст во время записи, создавая транскрипт с временными метками и метками спикеров в режиме реального времени.

Думайте об этом так: представьте машинистку, сидящую рядом с вами на каждой встрече, мгновенно записывающую всё сказанное — с указанием принадлежности каждого слова и точного времени произнесения. Этот транскрипт доступен сразу после окончания встречи. Никакой задержки транскрипции. Никакого крутящегося индикатора "Обработка аудио".

Транскрипция в реальном времени работает параллельно с вашей сессией записи. С момента начала записи:

Механизм ИИ начинает прослушивание
Слова появляются в панели транскрипта в течение нескольких секунд после произнесения
Метки спикеров ("Спикер 1", "Спикер 2") присваиваются автоматически
Временные метки обозначают место каждого сегмента в записи

По остановке записи полный транскрипт автоматически сохраняется вместе с аудио/видеофайлом.

Перед началом

Для транскрипции в реальном времени необходимо настроить два условия перед первой сессией:

1. Функции ИИ включены

Откройте Настройки (значок шестерёнки ⚙️ в правом верхнем углу)
Перейдите в категорию ИИ
Убедитесь, что переключатель Функции ИИ установлен вкл (синий)

Если переключатель серый или категория ИИ отсутствует, обратитесь к администратору вашего аккаунта — для функций ИИ может потребоваться активная подписка.

2. Настроен API-ключ

Оставаясь в Настройки → ИИ:

Найдите поле API-ключ
Введите ваш API-ключ Gemini (см. Главу 31 для получения)
Нажмите Сохранить

Зелёная галочка подтверждает правильность ключа. Красное предупреждение означает, что ключ неверный или просрочен.

Примечание: Во время записи требуется активное подключение к интернету. Транскрипция в реальном времени не может работать офлайн.

Как начать сессию транскрипции в реальном времени

Начало транскрипции в реальном времени идентично запуску любой записи — нет отдельного "режима транскрипции" для включения. Если Функции ИИ включены и API-ключ настроен, транскрипция в реальном времени активируется автоматически.

Пошагово:

Нажмите красную кнопку записи 🔴 (или используйте горячую клавишу: Ctrl+Alt+A на Windows, Cmd+Shift+A на macOS)
- Что вы видите: Кнопка пульсирует красным. Таймер записи начинает отсчёт.
Смотрите, как появляется панель транскрипта
- Что вы видите: Панель выдвигается с правой стороны главного окна (или под плеером, в зависимости от вашего расположения). Кратко отображается "Подключение...".
Говорите как обычно
- Что вы видите: Через 2–5 секунд начинает появляться текст. Последняя фраза показывает лёгкую анимацию, пока ещё обрабатывается.
Продолжайте встречу или запись как обычно
- Что вы видите: Завершённые сегменты накапливаются в хронологическом порядке, каждый помечен меткой спикера и временной меткой.
Остановите запись по окончании
- Что вы видите: Кнопка возвращается в состояние покоя. Кратко мигает уведомление "Сохранение транскрипта...", затем исчезает. Транскрипт сохранён.

Что вы видите во время записи

Панель транскрипта имеет три основные области:

┌─────────────────────────────────────────────┐
│  Транскрипт                   🟢 Подключено  │
├─────────────────────────────────────────────┤
│  Спикер 1   0:00:12                         │
│  "Доброе утро всем, давайте начнём"         │
│                                             │
│  Спикер 2   0:00:24                         │
│  "Спасибо, что присоединились так быстро"   │
│                                             │
│  Спикер 1   0:00:31                         │
│  "Конечно. Первый пункт повестки дня…"     │
├─────────────────────────────────────────────┤
│  Говорит сейчас…  ████████░░░░              │
│  "…это обзор бюджета за Q3"                 │
└─────────────────────────────────────────────┘

Значение каждого элемента:

Элемент	Значение
Метка спикера	Кто говорит — присваивается автоматически ("Спикер 1", "Спикер 2")
Временная метка	Когда в записи начинается этот сегмент (часы:минуты:секунды)
Завершённый текст	Финализированные слова — они не изменятся
Предпросмотр "Говорит сейчас..."	Текущее высказывание ещё обрабатывается — может немного измениться
Индикатор статуса	🟢 Подключено · 🟡 Подключение · 🔴 Ошибка

Индикатор статуса подключения

Индикатор в правом верхнем углу панели показывает, доступен ли механизм ИИ:

🟢 Подключено — транскрипция работает нормально
🟡 Подключение — устанавливается соединение (норма при запуске, занимает 2–5 секунд)
🔴 Ошибка — соединение потеряно (см. раздел "Устранение неполадок" ниже)

Если отображается 🔴 Ошибка, сама запись продолжается без проблем — затронута только транскрипция в реальном времени.

Автоматическое определение спикеров

Механизм ИИ пытается различить разные голоса и присвоить каждому метку.

Как это работает:

Временная шкала записи:

0:00 ──────────────────────────────────────────────────► время
        │           │           │           │
      Спикер 1   Спикер 2   Спикер 1   Спикер 2
      "Утро"     "Привет"   "Повестка…" "Согласен"
          ▼           ▼           ▼           ▼
      [Сег. 1]    [Сег. 2]    [Сег. 3]    [Сег. 4]

Каждый раз при смене спикера система создаёт новый сегмент. Сегменты одного спикера получают одинаковую метку.

Начальные метки: Первый говорящий становится "Спикером 1", второй новый голос — "Спикером 2" и т.д. Это временные метки — их можно переименовать позже (см. Главу 29).

Уточнение спикеров: По мере записи ИИ может уточнять ранее сделанные назначения, если становится уверен, что два сегмента принадлежат одному голосу. Это нормально. Текст не изменяется — меняется только атрибуция спикера для прошлых сегментов.

Совет: Для наиболее точного разделения спикеров используйте наушники, а не динамики. Звук динамиков, уловленный вашим микрофоном, может запутать детектор.

После остановки записи

Когда вы нажимаете стоп:

Предпросмотр "Говорит сейчас..." финализирует любое незавершённое предложение
Полный транскрипт автоматически сохраняется вместе с файлом записи
Никаких ручных действий не требуется

Где найти транскрипт:

Откройте запись в Библиотеке записей
Нажмите Insights ИИ на панели деталей
Выберите вкладку Транскрипт

Транскрипт также доступен для экспорта в формате SRT (формат субтитров) или JSON со вкладки Insights ИИ. Подробности экспорта в Главе 28.

Ограничения

Понимание этих ограничений помогает формировать реалистичные ожидания:

Ограничение	Подробности
Требуется интернет	Транскрипция в реальном времени не работает офлайн. Аудио обрабатывается механизмом ИИ по сети.
Точность временных меток	Временные метки приблизительны (±3 секунды). Используйте их для навигации, а не для юридической документации.
Паузы в записи	При паузе записи транскрипция тоже приостанавливается. Паузированные сегменты не транскрибируются.
Точность варьируется	Точность наиболее высокая при чёткой речи, одном говорящем одновременно и хорошем микрофоне. Сильные акценты, фоновый шум или перебивание снижают точность.
Язык	Язык транскрипции можно установить на Авто-определение (рекомендуется) или конкретный язык в Настройки → ИИ → SeaMeet Integration. Авто-определение автоматически обрабатывает многоязычные встречи.
Нет редактирования в реальном времени	Нельзя редактировать транскрипт во время записи. Редактирование доступно после остановки записи.

Наложение субтитров при воспроизведении

При воспроизведении записи с транскриптом в реальном времени SeaMeet может отображать субтитры прямо на видео — как закрытые субтитры на телевизоре.

Как работают субтитры:

Текст субтитров накладывается на предпросмотр видео внизу кадра
Каждый сегмент показывает имя спикера (с цветовой кодировкой по спикеру) и произнесённый текст
Субтитры синхронизированы с позицией воспроизведения — они продвигаются по мере воспроизведения записи
Субтитры автоматически используют транскрипт Gemini Live из сессии

Цвета спикеров: Каждому спикеру присваивается постоянный цвет во всех субтитрах и панелях транскрипта. Цвета определяются автоматически и остаются неизменными на протяжении всей записи.

Формат субтитров:

[Спикер 1]: Доброе утро всем, давайте начнём.

Субтитры появляются и исчезают по мере воспроизведения соответствующего сегмента транскрипта.

Двухколонный видеомакет

При просмотре видеозаписи с доступным транскриптом в реальном времени SeaMeet использует двухколонный макет:

┌─────────────────────────────────────────────────────┐
│  Предпросмотр видео        │  Панель транскрипта     │
│                            │                         │
│  [видео с субтитрами]      │  Спикер 1   0:00:12    │
│                            │  "Доброе утро..."      │
│                            │                         │
│                            │  Спикер 2   0:00:24    │
│                            │  "Спасибо за участие"  │
│                            │              [⤢ Макс]  │
└─────────────────────────────────────────────────────┘

Левая колонка: Видео фиксированной ширины с наложением субтитров
Правая колонка: Прокручиваемая панель транскрипта, синхронизированная с позицией воспроизведения
Кнопка "Развернуть" (⤢): Разворачивает панель транскрипта во весь экран для удобного чтения длинных записей

Двухколонный макет отображается только для видеозаписей с транскриптами в реальном времени. Записи только аудио и записи без транскриптов используют стандартный одноколонный макет.

Настройки языка транскрипции

Вы можете настроить, какой язык SeaMeet ожидает при транскрипции в реальном времени:

Откройте Настройки (⚙️)
Перейдите в ИИ → SeaMeet Integration
Найдите селектор Язык встречи
Выберите язык:
- Авто-определение (по умолчанию, рекомендуется) — SeaMeet автоматически определяет язык речи. Лучший вариант для многоязычных встреч или когда язык варьируется.
- Ручной выбор — выберите из 20+ конкретных языков, включая русский, английский (США/Великобритания), испанский, французский, немецкий, японский, мандаринский, кантонский, корейский и другие.

Совет: Оставьте язык на Авто-определении, если нет конкретной причины принудительно задать язык. Авто-определение лучше справляется с акцентами и смешанноязычными встречами, чем принудительно заданная настройка.

Устранение неполадок

"Панель транскрипта не появляется"

Симптом: Вы начинаете запись, но панель транскрипта так и не появляется.

Проверьте по порядку:

Перейдите в Настройки → ИИ и убедитесь, что переключатель Функции ИИ включён
Убедитесь, что ваш API-ключ действителен (зелёная галочка в Настройки → ИИ)
Проверьте подключение к интернету — попробуйте открыть веб-страницу
Перезапустите SeaMeet и попробуйте снова

Если панель всё ещё не появляется после всех четырёх шагов, служба ИИ может быть временно недоступна. Сама запись не затронута — попробуйте позже.

"Соединение прервалось в середине записи"

Симптом: Индикатор статуса становится 🔴 красным во время записи.

Что произошло: Соединение с механизмом ИИ было прервано. Это может произойти из-за:

Временного прерывания сети
Переключения Wi-Fi между точками доступа
Кратковременного отключения службы ИИ

Что делать:

Не останавливайте запись — она продолжается безопасно
Проверьте подключение к интернету
Соединение обычно восстанавливается автоматически в течение 30 секунд
Слова, произнесённые в период отключения, не восстанавливаются — они потеряны для транскрипта в реальном времени (но аудио остаётся в файле записи, поэтому вы можете запустить Извлечение ИИ постфактум — см. Главу 28)

"Спикеры определены неверно"

Симптом: Несколько человек помечены как "Спикер 1", или один человек появляется как два разных спикера.

Что происходит: Определение спикеров использует голосовые характеристики. Точность снижается при:

Одновременном разговоре нескольких людей
Значительном изменении голоса спикера (смех, повышенный голос, плохое аудио)
Помехах фонового шума

Что делать:

После записи переименуйте спикеров на панели Спикеров (см. Главу 29)
Используйте функцию Объединить для слияния двух меток, принадлежащих одному человеку (Глава 29)

Лучшие практики

Следуйте этим практикам для наилучших результатов транскрипции в реальном времени:

Один спикер за раз Перебивание (когда двое говорят одновременно) запутывает определение спикеров и создаёт несвязный текст в транскрипте. Поощряйте участников говорить по очереди.

Тихая среда записи Фоновый шум — системы кондиционирования, печатание, уличный шум — улавливается микрофоном и снижает точность транскрипции. Гарнитурный микрофон, расположенный близко к губам, даёт значительно лучшие результаты, чем встроенный микрофон ноутбука.

Правильное расположение микрофона На очных встречах с несколькими участниками располагайте микрофон ближе к центру стола или используйте индивидуальные микрофоны для каждого участника.

Стабильное подключение к интернету Используйте проводное соединение или сильный сигнал Wi-Fi. Избегайте мобильных точек доступа или сетей с высокими потерями пакетов — они вызывают разрывы соединения.

Переименовывайте спикеров своевременно Делайте переименование спикеров сразу после записи, пока вы помните, кто что говорил. Инструкции в Главе 29.

Краткий справочник

┌────────────────────────────────────────────────────────────┐
│           ТРАНСКРИПЦИЯ В РЕАЛЬНОМ ВРЕМЕНИ                  │
│                  Краткий справочник                         │
├────────────────────────────────────────────────────────────┤
│  Старт           │ Записывайте как обычно — авто-активация  │
│  Статус: зелёный │ 🟢 Транскрипция работает                │
│  Статус: жёлтый  │ 🟡 Подключение (подождите 5 с)          │
│  Статус: красный │ 🔴 Отключено — запись безопасна          │
├────────────────────────────────────────────────────────────┤
│  Панель транскр. │ Правая сторона главного окна            │
│  Строка предпр.  │ "Говорит сейчас..." — в процессе        │
│  Завершённые     │ Финальные — не изменятся                │
├────────────────────────────────────────────────────────────┤
│  После остановки │ Транскрипт сохраняется автоматически    │
│  Найти           │ Запись → Insights ИИ → Транскрипт       │
├────────────────────────────────────────────────────────────┤
│  Требуется       │ Интернет + Функции ИИ вкл + API-ключ    │
│  Временные метки │ Приблизительно ±3 секунды               │
│  Паузы           │ Не транскрибируются                     │
└────────────────────────────────────────────────────────────┘

Last updated: 2026-03-20

← Глава 26: Глоссарий терминов | Глава 28: Извлечение ИИ →