SeaMeet Desktop здесь — Записывайте всё, не упускайте ничего. Скачать бесплатно →

Транскрипция в реальном времени — слова на экране по мере вашей речи

Глава 27: Транскрипция в реальном времени — слова на экране по мере вашей речи

Представьте стенографиста, который печатает по ходу заседания — каждое слово фиксируется в момент его произнесения, без ожидания окончания встречи. Именно это делает транскрипция в реальном времени SeaMeet для ваших записей. Пока вы говорите, панель транскрипта заполняется в реальном времени: метки спикеров, временные метки и сами слова — всё появляется по ходу разговора.

Никакого ожидания. Никакого шага загрузки. Просто слова на экране.


Цели главы

После прочтения этой главы вы сможете:

  • Понять, что такое транскрипция в реальном времени и когда её использовать
  • Настроить необходимые условия перед началом
  • Начать сессию записи с активной транскрипцией в реальном времени
  • Читать и интерпретировать панель транскрипта во время записи
  • Понять, как работает автоматическое определение спикеров
  • Устранять наиболее распространённые проблемы с подключением и отображением

Что такое транскрипция в реальном времени?

Транскрипция в реальном времени преобразует аудио из вашей записи в текст во время записи, создавая транскрипт с временными метками и метками спикеров в режиме реального времени.

Думайте об этом так: представьте машинистку, сидящую рядом с вами на каждой встрече, мгновенно записывающую всё сказанное — с указанием принадлежности каждого слова и точного времени произнесения. Этот транскрипт доступен сразу после окончания встречи. Никакой задержки транскрипции. Никакого крутящегося индикатора "Обработка аудио".

Транскрипция в реальном времени работает параллельно с вашей сессией записи. С момента начала записи:

  • Механизм ИИ начинает прослушивание
  • Слова появляются в панели транскрипта в течение нескольких секунд после произнесения
  • Метки спикеров ("Спикер 1", "Спикер 2") присваиваются автоматически
  • Временные метки обозначают место каждого сегмента в записи

По остановке записи полный транскрипт автоматически сохраняется вместе с аудио/видеофайлом.


Перед началом

Для транскрипции в реальном времени необходимо настроить два условия перед первой сессией:

1. Функции ИИ включены

  1. Откройте Настройки (значок шестерёнки ⚙️ в правом верхнем углу)
  2. Перейдите в категорию ИИ
  3. Убедитесь, что переключатель Функции ИИ установлен вкл (синий)

Если переключатель серый или категория ИИ отсутствует, обратитесь к администратору вашего аккаунта — для функций ИИ может потребоваться активная подписка.

2. Настроен API-ключ

Оставаясь в Настройки → ИИ:

  1. Найдите поле API-ключ
  2. Введите ваш API-ключ Gemini (см. Главу 31 для получения)
  3. Нажмите Сохранить

Зелёная галочка подтверждает правильность ключа. Красное предупреждение означает, что ключ неверный или просрочен.

Примечание: Во время записи требуется активное подключение к интернету. Транскрипция в реальном времени не может работать офлайн.


Как начать сессию транскрипции в реальном времени

Начало транскрипции в реальном времени идентично запуску любой записи — нет отдельного "режима транскрипции" для включения. Если Функции ИИ включены и API-ключ настроен, транскрипция в реальном времени активируется автоматически.

Пошагово:

  1. Нажмите красную кнопку записи 🔴 (или используйте горячую клавишу: Ctrl+Alt+A на Windows, Cmd+Shift+A на macOS)

    • Что вы видите: Кнопка пульсирует красным. Таймер записи начинает отсчёт.
  2. Смотрите, как появляется панель транскрипта

    • Что вы видите: Панель выдвигается с правой стороны главного окна (или под плеером, в зависимости от вашего расположения). Кратко отображается "Подключение...".
  3. Говорите как обычно

    • Что вы видите: Через 2–5 секунд начинает появляться текст. Последняя фраза показывает лёгкую анимацию, пока ещё обрабатывается.
  4. Продолжайте встречу или запись как обычно

    • Что вы видите: Завершённые сегменты накапливаются в хронологическом порядке, каждый помечен меткой спикера и временной меткой.
  5. Остановите запись по окончании

    • Что вы видите: Кнопка возвращается в состояние покоя. Кратко мигает уведомление "Сохранение транскрипта...", затем исчезает. Транскрипт сохранён.

Что вы видите во время записи

Панель транскрипта имеет три основные области:

┌─────────────────────────────────────────────┐
│  Транскрипт                   🟢 Подключено  │
├─────────────────────────────────────────────┤
│  Спикер 1   0:00:12                         │
│  "Доброе утро всем, давайте начнём"         │
│                                             │
│  Спикер 2   0:00:24                         │
│  "Спасибо, что присоединились так быстро"   │
│                                             │
│  Спикер 1   0:00:31                         │
│  "Конечно. Первый пункт повестки дня…"     │
├─────────────────────────────────────────────┤
│  Говорит сейчас…  ████████░░░░              │
│  "…это обзор бюджета за Q3"                 │
└─────────────────────────────────────────────┘

Значение каждого элемента:

ЭлементЗначение
Метка спикераКто говорит — присваивается автоматически ("Спикер 1", "Спикер 2")
Временная меткаКогда в записи начинается этот сегмент (часы:минуты:секунды)
Завершённый текстФинализированные слова — они не изменятся
Предпросмотр "Говорит сейчас..."Текущее высказывание ещё обрабатывается — может немного измениться
Индикатор статуса🟢 Подключено · 🟡 Подключение · 🔴 Ошибка

Индикатор статуса подключения

Индикатор в правом верхнем углу панели показывает, доступен ли механизм ИИ:

  • 🟢 Подключено — транскрипция работает нормально
  • 🟡 Подключение — устанавливается соединение (норма при запуске, занимает 2–5 секунд)
  • 🔴 Ошибка — соединение потеряно (см. раздел "Устранение неполадок" ниже)

Если отображается 🔴 Ошибка, сама запись продолжается без проблем — затронута только транскрипция в реальном времени.


Автоматическое определение спикеров

Механизм ИИ пытается различить разные голоса и присвоить каждому метку.

Как это работает:

Временная шкала записи:

0:00 ──────────────────────────────────────────────────► время
        │           │           │           │
      Спикер 1   Спикер 2   Спикер 1   Спикер 2
      "Утро"     "Привет"   "Повестка…" "Согласен"
          ▼           ▼           ▼           ▼
      [Сег. 1]    [Сег. 2]    [Сег. 3]    [Сег. 4]

Каждый раз при смене спикера система создаёт новый сегмент. Сегменты одного спикера получают одинаковую метку.

Начальные метки: Первый говорящий становится "Спикером 1", второй новый голос — "Спикером 2" и т.д. Это временные метки — их можно переименовать позже (см. Главу 29).

Уточнение спикеров: По мере записи ИИ может уточнять ранее сделанные назначения, если становится уверен, что два сегмента принадлежат одному голосу. Это нормально. Текст не изменяется — меняется только атрибуция спикера для прошлых сегментов.

Совет: Для наиболее точного разделения спикеров используйте наушники, а не динамики. Звук динамиков, уловленный вашим микрофоном, может запутать детектор.


После остановки записи

Когда вы нажимаете стоп:

  1. Предпросмотр "Говорит сейчас..." финализирует любое незавершённое предложение
  2. Полный транскрипт автоматически сохраняется вместе с файлом записи
  3. Никаких ручных действий не требуется

Где найти транскрипт:

  • Откройте запись в Библиотеке записей
  • Нажмите Insights ИИ на панели деталей
  • Выберите вкладку Транскрипт

Транскрипт также доступен для экспорта в формате SRT (формат субтитров) или JSON со вкладки Insights ИИ. Подробности экспорта в Главе 28.


Ограничения

Понимание этих ограничений помогает формировать реалистичные ожидания:

ОграничениеПодробности
Требуется интернетТранскрипция в реальном времени не работает офлайн. Аудио обрабатывается механизмом ИИ по сети.
Точность временных метокВременные метки приблизительны (±3 секунды). Используйте их для навигации, а не для юридической документации.
Паузы в записиПри паузе записи транскрипция тоже приостанавливается. Паузированные сегменты не транскрибируются.
Точность варьируетсяТочность наиболее высокая при чёткой речи, одном говорящем одновременно и хорошем микрофоне. Сильные акценты, фоновый шум или перебивание снижают точность.
ЯзыкЯзык транскрипции можно установить на Авто-определение (рекомендуется) или конкретный язык в Настройки → ИИ → SeaMeet Integration. Авто-определение автоматически обрабатывает многоязычные встречи.
Нет редактирования в реальном времениНельзя редактировать транскрипт во время записи. Редактирование доступно после остановки записи.

Наложение субтитров при воспроизведении

При воспроизведении записи с транскриптом в реальном времени SeaMeet может отображать субтитры прямо на видео — как закрытые субтитры на телевизоре.

Как работают субтитры:

  • Текст субтитров накладывается на предпросмотр видео внизу кадра
  • Каждый сегмент показывает имя спикера (с цветовой кодировкой по спикеру) и произнесённый текст
  • Субтитры синхронизированы с позицией воспроизведения — они продвигаются по мере воспроизведения записи
  • Субтитры автоматически используют транскрипт Gemini Live из сессии

Цвета спикеров: Каждому спикеру присваивается постоянный цвет во всех субтитрах и панелях транскрипта. Цвета определяются автоматически и остаются неизменными на протяжении всей записи.

Формат субтитров:

[Спикер 1]: Доброе утро всем, давайте начнём.

Субтитры появляются и исчезают по мере воспроизведения соответствующего сегмента транскрипта.


Двухколонный видеомакет

При просмотре видеозаписи с доступным транскриптом в реальном времени SeaMeet использует двухколонный макет:

┌─────────────────────────────────────────────────────┐
│  Предпросмотр видео        │  Панель транскрипта     │
│                            │                         │
│  [видео с субтитрами]      │  Спикер 1   0:00:12    │
│                            │  "Доброе утро..."      │
│                            │                         │
│                            │  Спикер 2   0:00:24    │
│                            │  "Спасибо за участие"  │
│                            │              [⤢ Макс]  │
└─────────────────────────────────────────────────────┘
  • Левая колонка: Видео фиксированной ширины с наложением субтитров
  • Правая колонка: Прокручиваемая панель транскрипта, синхронизированная с позицией воспроизведения
  • Кнопка "Развернуть" (⤢): Разворачивает панель транскрипта во весь экран для удобного чтения длинных записей

Двухколонный макет отображается только для видеозаписей с транскриптами в реальном времени. Записи только аудио и записи без транскриптов используют стандартный одноколонный макет.


Настройки языка транскрипции

Вы можете настроить, какой язык SeaMeet ожидает при транскрипции в реальном времени:

  1. Откройте Настройки (⚙️)
  2. Перейдите в ИИSeaMeet Integration
  3. Найдите селектор Язык встречи
  4. Выберите язык:
    • Авто-определение (по умолчанию, рекомендуется) — SeaMeet автоматически определяет язык речи. Лучший вариант для многоязычных встреч или когда язык варьируется.
    • Ручной выбор — выберите из 20+ конкретных языков, включая русский, английский (США/Великобритания), испанский, французский, немецкий, японский, мандаринский, кантонский, корейский и другие.

Совет: Оставьте язык на Авто-определении, если нет конкретной причины принудительно задать язык. Авто-определение лучше справляется с акцентами и смешанноязычными встречами, чем принудительно заданная настройка.


Устранение неполадок

"Панель транскрипта не появляется"

Симптом: Вы начинаете запись, но панель транскрипта так и не появляется.

Проверьте по порядку:

  1. Перейдите в Настройки → ИИ и убедитесь, что переключатель Функции ИИ включён
  2. Убедитесь, что ваш API-ключ действителен (зелёная галочка в Настройки → ИИ)
  3. Проверьте подключение к интернету — попробуйте открыть веб-страницу
  4. Перезапустите SeaMeet и попробуйте снова

Если панель всё ещё не появляется после всех четырёх шагов, служба ИИ может быть временно недоступна. Сама запись не затронута — попробуйте позже.


"Соединение прервалось в середине записи"

Симптом: Индикатор статуса становится 🔴 красным во время записи.

Что произошло: Соединение с механизмом ИИ было прервано. Это может произойти из-за:

  • Временного прерывания сети
  • Переключения Wi-Fi между точками доступа
  • Кратковременного отключения службы ИИ

Что делать:

  1. Не останавливайте запись — она продолжается безопасно
  2. Проверьте подключение к интернету
  3. Соединение обычно восстанавливается автоматически в течение 30 секунд
  4. Слова, произнесённые в период отключения, не восстанавливаются — они потеряны для транскрипта в реальном времени (но аудио остаётся в файле записи, поэтому вы можете запустить Извлечение ИИ постфактум — см. Главу 28)

"Спикеры определены неверно"

Симптом: Несколько человек помечены как "Спикер 1", или один человек появляется как два разных спикера.

Что происходит: Определение спикеров использует голосовые характеристики. Точность снижается при:

  • Одновременном разговоре нескольких людей
  • Значительном изменении голоса спикера (смех, повышенный голос, плохое аудио)
  • Помехах фонового шума

Что делать:

  • После записи переименуйте спикеров на панели Спикеров (см. Главу 29)
  • Используйте функцию Объединить для слияния двух меток, принадлежащих одному человеку (Глава 29)

Лучшие практики

Следуйте этим практикам для наилучших результатов транскрипции в реальном времени:

Один спикер за раз Перебивание (когда двое говорят одновременно) запутывает определение спикеров и создаёт несвязный текст в транскрипте. Поощряйте участников говорить по очереди.

Тихая среда записи Фоновый шум — системы кондиционирования, печатание, уличный шум — улавливается микрофоном и снижает точность транскрипции. Гарнитурный микрофон, расположенный близко к губам, даёт значительно лучшие результаты, чем встроенный микрофон ноутбука.

Правильное расположение микрофона На очных встречах с несколькими участниками располагайте микрофон ближе к центру стола или используйте индивидуальные микрофоны для каждого участника.

Стабильное подключение к интернету Используйте проводное соединение или сильный сигнал Wi-Fi. Избегайте мобильных точек доступа или сетей с высокими потерями пакетов — они вызывают разрывы соединения.

Переименовывайте спикеров своевременно Делайте переименование спикеров сразу после записи, пока вы помните, кто что говорил. Инструкции в Главе 29.


Краткий справочник

┌────────────────────────────────────────────────────────────┐
│           ТРАНСКРИПЦИЯ В РЕАЛЬНОМ ВРЕМЕНИ                  │
│                  Краткий справочник                         │
├────────────────────────────────────────────────────────────┤
│  Старт           │ Записывайте как обычно — авто-активация  │
│  Статус: зелёный │ 🟢 Транскрипция работает                │
│  Статус: жёлтый  │ 🟡 Подключение (подождите 5 с)          │
│  Статус: красный │ 🔴 Отключено — запись безопасна          │
├────────────────────────────────────────────────────────────┤
│  Панель транскр. │ Правая сторона главного окна            │
│  Строка предпр.  │ "Говорит сейчас..." — в процессе        │
│  Завершённые     │ Финальные — не изменятся                │
├────────────────────────────────────────────────────────────┤
│  После остановки │ Транскрипт сохраняется автоматически    │
│  Найти           │ Запись → Insights ИИ → Транскрипт       │
├────────────────────────────────────────────────────────────┤
│  Требуется       │ Интернет + Функции ИИ вкл + API-ключ    │
│  Временные метки │ Приблизительно ±3 секунды               │
│  Паузы           │ Не транскрибируются                     │
└────────────────────────────────────────────────────────────┘

Last updated: 2026-03-20

Глава 26: Глоссарий терминов | Глава 28: Извлечение ИИ →

Published: