Extracción de IA - Deja que SeaMeet tome las notas
Capítulo 28: Extracción de IA — Deja que SeaMeet tome las notas
Imagina contratar a un asistente que participa en cada reunión, escribe el resumen, extrae los elementos de acción, señala las decisiones clave y marca con timestamps cada cambio de tema—mientras tú te concentras en la conversación. Eso es exactamente lo que hace la Extracción de IA. Apúntala a cualquier grabación de tu biblioteca y devuelve cinco salidas estructuradas: una transcripción completa, un resumen conciso, elementos de acción, decisiones clave y capítulos con marcas de tiempo.
Sin escribir. Sin rebobinar. Sin adivinar qué se decidió.
Objetivos del capítulo
Después de leer este capítulo, podrás:
- Entender qué produce la Extracción de IA y cuándo usarla
- Configurar los requisitos previos
- Generar tu primera extracción
- Navegar y usar cada una de las cinco pestañas de salida
- Usar el OCR de capturas de pantalla para extraer texto automáticamente y copiarlo al portapapeles
- Regenerar resultados y entender cómo se conservan las versiones anteriores
- Exportar resultados en múltiples formatos
- Solucionar problemas comunes de extracción
¿Qué es la Extracción de IA?
La Extracción de IA es un proceso de análisis posterior a la grabación. Una vez completada tu grabación, la activas con un solo clic. El motor de IA procesa el audio y devuelve cinco salidas estructuradas:
| Pestaña | Qué contiene |
|---|---|
| Transcripción | Texto palabra por palabra con marcas de tiempo de todo lo dicho |
| Resumen | Una narrativa concisa de lo que se discutió |
| Acciones | Tareas identificadas en la conversación, con responsables y fechas límite cuando se mencionaron |
| Decisiones | Elecciones clave que se tomaron durante la reunión |
| Capítulos | Segmentos de temas indexados por tiempo — como capítulos en un libro |
Piénsalo así: La grabación es el material en bruto. La Extracción de IA es el editor que lo observa y lo convierte en algo estructurado y utilizable.
La Extracción de IA funciona con cualquier grabación de tu biblioteca—tanto si usaste Transcripción en vivo durante la grabación como si no. Si se realizó una Transcripción en vivo, la Extracción puede seguir siendo útil como segundo análisis, produciendo resúmenes y salidas estructuradas que la Transcripción en vivo sola no proporciona.
Antes de comenzar
Requisitos
- Funciones de IA activadas: Configuración → IA → activar
- Clave de API configurada: Configuración → IA → campo Clave de API (marca de verificación verde = válida)
- Conexión a internet activa durante la extracción
- Una grabación en tu biblioteca — cualquier archivo de audio o vídeo que SeaMeet haya grabado o importado
¿Cuánto tarda la extracción?
El tiempo de procesamiento escala con la duración de la grabación:
| Duración de la grabación | Tiempo aproximado |
|---|---|
| Menos de 15 minutos | 20–40 segundos |
| 15–60 minutos | 1–3 minutos |
| 1–2 horas | 3–6 minutos |
| Más de 2 horas | 5–10 minutos |
Estas son estimaciones. El tiempo real depende de la carga del servidor y tu velocidad de internet.
Generar tu primera extracción
-
Abre una grabación desde tu Biblioteca de Grabaciones
- Lo que ves: El panel de detalles de la grabación se abre en el lado derecho, mostrando el reproductor e información de la grabación.
-
Haz clic en la pestaña "AI Insights" en el panel de detalles
- Lo que ves: Aparece el panel de AI Insights con un aviso "Generate Summary" si no se ha ejecutado ninguna extracción todavía. Un icono ✨ marca el botón.
-
Haz clic en ✨ "Generate Summary"
- Lo que ves: La etiqueta del botón cambia a un indicador de carga. Una barra de progreso o mensaje de estado ("Analysing audio…", "Generating summary…") se actualiza mientras la IA procesa el contenido.
-
Espera los resultados
- Lo que ves: Cuando finaliza, las cinco pestañas se completan con contenido. La barra de pestañas en la parte superior del panel de AI Insights muestra: Transcript · Summary · Actions · Decisions · Chapters.
-
Explora las pestañas (consulta las secciones a continuación para saber qué buscar en cada una)
Entender cada pestaña
Transcripción
La pestaña Transcript muestra un texto completo palabra por palabra de la grabación, dividido en segmentos con marcas de tiempo y etiquetas de hablante.
┌──────────────────────────────────────────────────────────┐
│ Transcript │ Summary │ Actions │ Decisions │ Chapters │
├──────────────────────────────────────────────────────────┤
│ Hablante 1 ► 0:00:08 │
│ "Buenos días a todos. Empecemos con la │
│ revisión del presupuesto del T3." │
│ │
│ Hablante 2 ► 0:00:21 │
│ "Gracias. He preparado las diapositivas. ¿Empezamos │
│ con ingresos o gastos?" │
│ │
│ Hablante 1 ► 0:00:30 │
│ "Primero los ingresos. Alice, ¿puedes explicarnos?" │
└──────────────────────────────────────────────────────────┘
Al hacer clic en una marca de tiempo (el enlace ► 0:00:08 junto a cada segmento) el reproductor de audio/vídeo salta a ese momento exacto. Esto hace que sea rápido verificar una cita o encontrar una discusión específica sin buscar manualmente.
Las etiquetas de hablante tienen como valor predeterminado "Speaker 1", "Speaker 2", etc. Puedes renombrarlas—consulta el Capítulo 29.
Resumen
La pestaña Summary contiene una narrativa concisa de lo que ocurrió en la grabación. No es una lista de palabras transcritas—es una visión general sintetizada que captura los puntos principales discutidos.
Ejemplo (para una reunión de presupuesto de 45 minutos):
El equipo revisó el rendimiento de ingresos del T3, que resultó un 8% por encima de las previsiones. Los sobrecostes en el presupuesto de marketing se identificaron como la principal preocupación de cara al T4. Alice propuso una reducción del 15% en el gasto en publicidad de pago, que fue aceptada pendiente de aprobación definitiva por parte del área financiera. El grupo acordó reunirse de nuevo el martes siguiente para revisar las proyecciones revisadas.
El resumen está diseñado para ser compartible—puedes copiarlo en un correo electrónico, una herramienta de gestión de proyectos o un documento sin necesidad de editarlo.
Acciones
La pestaña Actions enumera las tareas que fueron explícita o implícitamente asignadas durante la grabación.
┌──────────────────────────────────────────────────────────┐
│ Acciones │
├──────────────────────────────────────────────────────────┤
│ □ Reducir el gasto en publicidad de pago un 15% │
│ Asignado a: Alice · Plazo: Antes de la reunión del │
│ martes ► 0:32:14 (en la grabación) │
│ │
│ □ Enviar proyecciones revisadas del T4 al equipo │
│ Asignado a: Equipo financiero · Plazo: Viernes │
│ ► 0:41:08 (en la grabación) │
│ │
│ □ Programar reunión de seguimiento para el martes │
│ Asignado a: (no especificado) · Sin fecha límite │
│ ► 0:43:55 (en la grabación) │
└──────────────────────────────────────────────────────────┘
Cada acción incluye:
- La tarea — qué hay que hacer
- Responsable — a quién se le pidió hacerlo (si se mencionó)
- Fecha límite — cuándo se necesita (si se mencionó)
- Enlace de marca de tiempo — ir al punto de la grabación donde se discutió
Nota: La IA extrae acciones de lo que se dijo. Si algo se discutió pero no se realizó una asignación clara, puede que aparezca o no aquí. Siempre verifica con la grabación o la transcripción.
Decisiones
La pestaña Decisions enumera las elecciones y acuerdos clave alcanzados durante la grabación.
┌──────────────────────────────────────────────────────────┐
│ Decisiones │
├──────────────────────────────────────────────────────────┤
│ ✓ Aprobada reducción del 15% en gasto en publicidad │
│ de pago del T4 ► 0:32:14 │
│ │
│ ✓ Rendimiento de ingresos del T3 aceptado como │
│ definitivo (sin recuento) ► 0:12:45 │
│ │
│ ✓ Reunión de seguimiento del martes confirmada │
│ ► 0:43:55 │
└──────────────────────────────────────────────────────────┘
Las decisiones son distintas de las acciones: una decisión es lo que se acordó, mientras que una acción es lo que alguien debe hacer como resultado.
Capítulos
La pestaña Chapters divide la grabación en segmentos de temas indexados por tiempo, como capítulos en un libro o capítulos en un DVD.
┌──────────────────────────────────────────────────────────┐
│ Capítulos │
├──────────────────────────────────────────────────────────┤
│ ► 0:00:00 Introducción y aspectos organizativos 3 min │
│ ► 0:03:10 Revisión de ingresos del T3 12 min │
│ ► 0:15:22 Análisis de gastos — Marketing 10 min │
│ ► 0:25:41 Propuestas de presupuesto del T4 18 min │
│ ► 0:43:30 Cierre y próximos pasos 4 min │
└────────────────────── ────────────────────────────────────┘
Al hacer clic en cualquier capítulo el reproductor salta al tiempo de inicio de ese tema. Si quieres escuchar de nuevo solo la discusión sobre las propuestas de presupuesto, haz clic en ► 0:25:41.
Los capítulos son especialmente útiles para grabaciones largas donde deseas encontrar rápidamente un tema específico.
Sugerencia de cambio de nombre generada por IA
Después de que la Extracción de IA finalice, la IA puede sugerir un nombre de archivo más descriptivo para tu grabación basándose en el contenido de la reunión. Aparece un banner en la parte superior del panel de AI Insights:
┌──────────────────────────────────────────────────────────────┐
│ Nuevo nombre de archivo: Revisión Presupuesto T3 — Reunión │
│ Equipo 15 Oct [ Rename ] │
└──────────────────────────────────────────────────────────────┘
Para aplicar el nombre sugerido:
- Haz clic en Rename — el archivo de grabación y su entrada en la biblioteca se renombran inmediatamente.
- El banner de sugerencia desaparece tras el cambio de nombre.
Para conservar tu nombre original:
- Ignora el banner — no se aplica automáticamente y desaparece si navegas a otra parte.
Nota: La sugerencia se basa en el contenido de la reunión. Para una grabación genérica o corta, el nombre sugerido puede ser similar al original. Siempre tienes la última palabra.
Selección de modelo Gemini
SeaMeet obtiene los modelos Gemini disponibles de la API de Google de forma dinámica — la lista de modelos se mantiene actualizada a medida que Google lanza nuevas versiones.
Qué modelo se usa:
- SeaMeet filtra automáticamente los modelos compatibles con texto, visión y audio (necesarios para el análisis de reuniones)
- Solo se muestran los modelos actuales y con capacidad — se excluyen los modelos más antiguos o limitados
- La lista está ordenada con los modelos más recientes/capaces primero
Puedes ver y cambiar el modelo activo en Configuración → IA → Modelo. El valor predeterminado es el modelo disponible más capaz. Rara vez hay razón para cambiarlo, a menos que necesites reducir costes o evitar una limitación específica del modelo.
OCR de capturas de pantalla — Extraer texto automáticamente y copiar al portapapeles
La Extracción de IA no se limita a las grabaciones de audio. Cuando tomas una captura de pantalla con la opción "Extract text (OCR) and copy to clipboard" activada, SeaMeet ejecuta automáticamente OCR en la imagen capturada y copia el texto extraído al portapapeles.
Cómo funciona
- Antes de capturar: Marca la casilla "Extract text (OCR) and copy to clipboard" en el Capture Hub o en la superposición del selector de región
- Toma la captura de pantalla (pantalla completa o captura de área)
- Espera ~15–30 segundos — el proceso de IA procesa la imagen en segundo plano
- El texto se copia al portapapeles — una notificación confirma "Texto extraído copiado al portapapeles"
- Pega en cualquier lugar — Cmd+V / Ctrl+V pega el texto extraído
El proceso OCR se ejecuta completamente en segundo plano. Puedes seguir usando SeaMeet o cambiar a otras aplicaciones mientras se procesa. El portapapeles se actualiza automáticamente cuando la extracción finaliza.
Dónde encontrar la configuración
La opción de copia automática OCR aparece en tres lugares:
| Ubicación | Qué controla |
|---|---|
| Capture Hub (panel de capturas) | Selector por captura — casilla debajo del selector de modo de captura |
| Selector de región (superposición) | Selector por captura — casilla cerca de "Capture Screen or Press Enter" |
| Configuración → AI Extraction & Summary | Activar/desactivar por defecto — selector "Auto-extract text (OCR) on screenshot" |
Los tres lugares se mantienen sincronizados. Cambiar en cualquiera de ellos actualiza los demás.
Requisitos
- Clave API de Gemini configurada (o suscripción activa con clave gestionada)
- Funciones de IA activadas en Configuración
Si no hay Clave API disponible, la casilla se muestra en gris y muestra "(Se requiere Clave API, suscríbete aquí)" con un enlace al portal de suscripción.
Qué se extrae
El proceso OCR extrae todo el texto visible de la captura de pantalla — incluyendo:
- Etiquetas de UI, menús y botones
- Contenido de documentos y páginas web
- Mensajes de error y texto de diálogos
- Código y salida de terminal
- Texto escrito a mano (si es legible)
El texto extraído también se guarda en el panel de Extracción de IA de la captura bajo la pestaña Text (OCR), para que puedas revisarlo o copiarlo de nuevo más tarde.
Regenerar
Si no estás satisfecho con los resultados, o si deseas un nuevo análisis tras renombrar los hablantes, puedes regenerar.
-
Haz clic en el botón ⟳ (regenerar) en la barra de pestañas
- Lo que ves: El botón gira. Un aviso breve "Processing…" reemplaza el contenido.
-
Espera (misma duración que la generación inicial)
- Lo que ves: Las cinco pestañas se actualizan con nuevos resultados.
-
Revisa los nuevos resultados
Importante: Antes de sobrescribir tus resultados, SeaMeet archiva automáticamente la extracción anterior como una instantánea de versión. Nada se pierde nunca. Puedes explorar versiones anteriores en cualquier momento—consulta el Capítulo 29, Parte B.
Exportar
La barra de pestañas incluye botones de exportación que te permiten llevar los resultados fuera de SeaMeet:
[Transcript] [Summary] [Actions] [Decisions] [Chapters] · [MD] [SRT] [JSON] [⟳]
| Botón | Formato | Ideal para |
|---|---|---|
| MD | Markdown | Aplicaciones de notas (Notion, Obsidian), documentación |
| SRT | SubRip subtítulo | Añadir subtítulos a archivos de vídeo (iMovie, Premiere, YouTube) |
| JSON | Datos JSON | Desarrolladores, importar en otras herramientas |
La pestaña activa determina qué se exporta:
- En la pestaña Summary → MD exporta el texto del resumen
- En la pestaña Transcript → SRT exporta la transcripción con marcas de tiempo como subtítulos
- En la pestaña Actions → MD o JSON exporta la lista de elementos de acción
Consejo: Exporta antes de regenerar si deseas una copia independiente de los resultados actuales—aunque esto no es estrictamente necesario ya que el historial de versiones preserva automáticamente los resultados anteriores (consulta el Capítulo 29).
Solución de problemas
"Extracción fallida"
Síntoma: El indicador de carga se detiene y aparece un mensaje de error: "Extraction failed" o "Something went wrong."
Prueba estos pasos en orden:
- Verifica tu conexión a internet — intenta cargar una página web
- Verifica que tu Clave de API sigue siendo válida (Configuración → IA → busca la marca de verificación verde)
- Espera 2–3 minutos e inténtalo de nuevo — el servicio de IA puede estar temporalmente sobrecargado
- Si la grabación es muy larga (2+ horas), intenta dividirla o permite más tiempo de procesamiento
"El resumen parece incompleto"
Síntoma: El resumen es corto, omite temas clave o parece genérico.
Posibles causas:
- La calidad del audio era deficiente — los errores de transcripción conducen a errores de extracción. Revisa la pestaña Transcript en busca de segmentos incomprensibles.
- La grabación capturó muy poca voz — si el audio del sistema dominaba (música, reproducción de vídeo), la IA puede haber tenido poco discurso con el que trabajar
- Grabación muy corta — las grabaciones de menos de 2 minutos producen resúmenes limitados
Qué probar:
- Vuelve a ejecutar la extracción con ⟳ después de renombrar los hablantes y revisar la transcripción
- Mejora la colocación del Micrófono para futuras grabaciones
"Los elementos de acción están vacíos"
Síntoma: La pestaña Actions está vacía incluso después de una reunión que claramente tenía tareas asignadas.
Qué está pasando: La IA extrae acciones del lenguaje explícito ("¿Puedes…?", "Me encargaré de…", "Asegurémonos de…"). Los compromisos implícitos o informales pueden pasarse por alto.
Qué probar:
- Revisa la pestaña Transcript — si la conversación fue informal, la IA puede no haber identificado un lenguaje de acción claro
- Este es el comportamiento esperado para conversaciones informales y exploratorias en lugar de reuniones estructuradas
Buenas prácticas
Mayor calidad de audio → mejores resultados Cada paso de extracción depende de la precisión de la transcripción. Una grabación hecha con un Micrófono de calidad en una habitación tranquila producirá resultados dramáticamente mejores que una con ruido de fondo y eco. Invierte en un auricular con Micrófono decente para las grabaciones habituales de reuniones.
Graba tanto el micrófono como el audio del sistema Si estás grabando una reunión virtual (Zoom, Teams, Google Meet), usa el modo de audio "Ambos" para que el audio del sistema (otros participantes) se capture junto a tu Micrófono. Una extracción de una conversación unilateral produce resultados unilaterales.
Renombra los hablantes antes de regenerar Los nombres de los hablantes aparecen en las pestañas Summary y Actions. Renombrar "Speaker 1" a "Alice" antes de hacer clic en ⟳ produce un resumen mucho más legible. Consulta el Capítulo 29 para saber cómo renombrar hablantes.
Las grabaciones más largas producen resúmenes más ricos Una reunión de 5 minutos producirá un resumen corto. Una discusión estratégica de 45 minutos producirá un resumen detallado y estructurado con secciones claras. La Extracción de IA es más valiosa para grabaciones sustanciales.
Usa los capítulos para navegar Para grabaciones de más de 20 minutos, revisa siempre primero la pestaña Chapters. Te ofrece un mapa de la discusión, lo que hace mucho más rápido saltar a la sección que te interesa.
Referencia rápida
┌────────────────────────────────────────────────────────────┐
│ EXTRACCIÓN DE IA │
│ Referencia rápida │
├────────────────────────────────────────────────────────────┤
│ Activar │ Pestaña AI Insights → ✨ Generate Summary│
│ Regenerar │ Botón ⟳ en la barra de pestañas │
│ Resultados prev. │ Archivados de forma segura — ver Cap. 29│
├────────────────────────────────────────────────────────────┤
│ Transcript │ Texto completo + marcas de tiempo │
│ Summary │ Visión general narrativa de la discusión│
│ Actions │ Tareas + responsables + fechas límite │
│ Decisions │ Acuerdos y elecciones tomadas │
│ Chapters │ Mapa de temas por tiempo, clic para ir │
├────────────────────────────────────────────────────────────┤
│ Exportar: MD │ Markdown — para apps de notas │
│ Exportar: SRT │ Subtítulos — para editores de vídeo │
│ Exportar: JSON │ Datos estructurados — para desarrolladores│
├────────────────────────────────────────────────────────────┤
│ OCR de capturas │ Extrac. auto de texto + copiar al portapapeles│
│ Config. OCR │ Casilla Capture Hub o Configuración → IA│
├────────────────────────────────────────────────────────────┤
│ Requiere │ Internet + Funciones de IA + Clave de API│
│ Funciona con │ Cualquier grabación o captura de pantalla│
└────────────────────────────────────────────────────────────┘
Última actualización: 2026-03-27
← Capítulo 27: Transcripción en vivo | Capítulo 29: Editar resultados de IA →
Published: