KI-Extraktion - Lassen Sie SeaMeet die Notizen übernehmen
Kapitel 28: KI-Extraktion — Lassen Sie SeaMeet die Notizen übernehmen
Stellen Sie sich vor, Sie stellen einen Assistenten ein, der an jedem Meeting teilnimmt, die Zusammenfassung schreibt, die Aktionspunkte herauszieht, die wichtigsten Entscheidungen markiert und jeden Themenwechsel mit Zeitstempel versieht — während Sie sich einfach auf das Gespräch konzentrieren. Genau das macht die KI-Extraktion. Richten Sie sie auf eine beliebige Aufnahme in Ihrer Bibliothek und sie gibt fünf strukturierte Ausgaben zurück: ein vollständiges Transkript, eine prägnante KI-Zusammenfassung, Aktionspunkte, wichtige Entscheidungen und Kapitel mit Zeitstempeln.
Kein Tippen. Kein Zurückspulen. Kein Raten, was entschieden wurde.
Kapitelziele
Nach dem Lesen dieses Kapitels können Sie:
- Verstehen, was die KI-Extraktion produziert und wann Sie sie einsetzen
- Voraussetzungen einrichten
- Ihre erste Extraktion generieren
- Jeden der fünf Ausgabe-Tabs navigieren und nutzen
- Screenshot-OCR verwenden, um automatisch Text zu extrahieren und in die Zwischenablage zu kopieren
- Ergebnisse neu generieren und verstehen, wie frühere Versionen erhalten bleiben
- Ergebnisse in mehreren Formaten exportieren
- Häufige Extraktionsprobleme beheben
Was ist die KI-Extraktion?
Die KI-Extraktion ist ein Nachbearbeitungs-Analyseprozess. Nachdem Ihre Aufnahme abgeschlossen ist, lösen Sie sie mit einem einzigen Klick aus. Das KI-Modul verarbeitet das Audio und gibt fünf strukturierte Ausgaben zurück:
| Tab | Was er enthält |
|---|---|
| Transcript | Wort-für-Wort-Text mit Zeitstempeln von allem Gesagten |
| Summary | Eine prägnante Erzählung über das Besprochene |
| Actions | Im Gespräch identifizierte Aufgaben, mit Verantwortlichen und Fälligkeitsdaten, sofern erwähnt |
| Decisions | Wichtige Entscheidungen, die während des Meetings getroffen wurden |
| Chapters | Zeitlich indexierte Themensegmente — wie Kapitel in einem Buch |
Stellen Sie es sich so vor: Die Aufnahme ist das Rohmaterial. Die KI-Extraktion ist der Redakteur, der es sich ansieht und in etwas Strukturiertes und Verwertbares umwandelt.
Die KI-Extraktion funktioniert mit jeder Aufnahme in Ihrer Bibliothek — unabhängig davon, ob Sie während der Aufnahme die Live-Transkription verwendet haben. Wenn die Live-Transkription aktiv war, kann die Extraktion dennoch als nützlicher zweiter Durchlauf dienen und Zusammenfassungen sowie strukturierte Ausgaben erzeugen, die die Live-Transkription allein nicht liefert.
Bevor Sie beginnen
Voraussetzungen
- KI-Funktionen aktiviert: Einstellungen → KI → einschalten
- API-Schlüssel konfiguriert: Einstellungen → KI → API-Schlüssel-Feld (grünes Häkchen = gültig)
- Aktive Internetverbindung während der Extraktion
- Eine Aufnahme in Ihrer Bibliothek — jede Audio- oder Videodatei, die SeaMeet aufgenommen oder importiert hat
Wie lange dauert die Extraktion?
Die Verarbeitungszeit skaliert mit der Länge der Aufnahme:
| Aufnahmedauer | Ungefähre Zeit |
|---|---|
| Unter 15 Minuten | 20–40 Sekunden |
| 15–60 Minuten | 1–3 Minuten |
| 1–2 Stunden | 3–6 Minuten |
| Über 2 Stunden | 5 –10 Minuten |
Dies sind Schätzungen. Die tatsächliche Zeit hängt von der Serverlast und Ihrer Internetgeschwindigkeit ab.
Ihre erste Extraktion generieren
-
Öffnen Sie eine Aufnahme aus Ihrer Aufnahmebibliothek
- Was Sie sehen: Das Aufnahme-Detailfeld öffnet sich auf der rechten Seite und zeigt den Player sowie Aufnahmeinformationen.
-
Klicken Sie auf den Tab "AI Insights" im Detailfeld
- Was Sie sehen: Das AI-Insights-Feld erscheint mit einer "Generate Summary"-Aufforderung, wenn noch keine Extraktion ausgeführt wurde. Ein ✨-Symbol markiert die Schaltfläche.
-
Klicken Sie auf ✨ "Generate Summary"
- Was Sie sehen: Die Schaltflächenbeschriftung wechselt zu einem Ladeindikator. Ein Fortschrittsbalken oder eine Statusmeldung ("Analysing audio…", "Generating summary…") aktualisiert sich, während die KI den Inhalt verarbeitet.
-
Warten Sie auf die Ergebnisse
- Was Sie sehen: Bei Abschluss füllen sich die fünf Tabs mit Inhalt. Die Tab-Leiste oben im AI-Insights-Feld zeigt: Transcript · Summary · Actions · Decisions · Chapters.
-
Durchsuchen Sie die Tabs (siehe Abschnitte unten, was in jedem Tab zu suchen ist)
Jeden Tab verstehen
Transkript
Der Transcript-Tab zeigt einen vollständigen Wort-für-Wort-Text der Aufnahme, aufgeteilt in Segmente mit Zeitstempeln und Sprecher-Beschriftungen.
┌──────────────────────────────────────────────────────────┐
│ Transcript │ Summary │ Actions │ Decisions │ Chapters │
├──────────────────────────────────────────────────────────┤
│ Sprecher 1 ► 0:00:08 │
│ „Guten Morgen alle zusammen. Fangen wir mit der │
│ Q3-Budgetbesprechung an." │
│ │
│ Sprecher 2 ► 0:00:21 │
│ „Danke. Ich habe die Folien vorbereitet. Fangen wir │
│ mit den Einnahmen oder Ausgaben an?" │
│ │
│ Sprecher 1 ► 0:00:30 │
│ „Zuerst die Einnahmen. Alice, kannst du uns führen?" │
└──────────────────────────────────────────────────────────┘
Auf einen Zeitstempel klicken (der ► 0:00:08-Link neben jedem Segment) springt der Audio-/Videoplayer zu genau diesem Moment. Das ermöglicht schnelles Überprüfen eines Zitats oder Finden einer bestimmten Diskussion ohne manuelles Scrubbing.
Sprecher-Beschriftungen sind standardmäßig "Speaker 1", "Speaker 2" usw. Sie können diese umbenennen — siehe Kapitel 29.
Zusammenfassung
Der Summary-Tab enthält eine prägnante Erzählung über das, was in der Aufnahme passiert ist. Es ist keine Aufzählung transkribierter Wörter — es ist ein synthetischer Überblick, der die wichtigsten besprochenen Punkte erfasst.
Beispiel (für ein 45-minütiges Budgetmeeting):
Das Team überprüfte die Q3-Umsatzleistung, die 8 % über der Prognose lag. Kostenüberschreitungen im Marketingbudget wurden als Hauptanliegen für Q4 identifiziert. Alice schlug eine Reduzierung der bezahlten Werbeausgaben um 15 % vor, die vorbehaltlich der endgültigen Genehmigung durch die Finanzabteilung akzeptiert wurde. Die Gruppe einigte sich darauf, sich am folgenden Dienstag wieder zu treffen, um die überarbeiteten Prognosen zu besprechen.
Die KI-Zusammenfassung ist so konzipiert, dass sie teilbar ist — Sie können sie in eine E-Mail, ein Projektmanagement-Tool oder ein Dokument kopieren, ohne sie zu bearbeiten.
Aktionen
Der Actions-Tab listet Aufgaben auf, die während der Aufnahme explizit oder implizit zugewiesen wurden.
┌──────────────────────────────────────────────────────────┐
│ Aktionen │
├──────────────────────────────────────────────────────────┤
│ □ Bezahlte Werbeausgaben um 15 % reduzieren │
│ Zugewiesen an: Alice · Fällig: Vor Dienstagssitzung│
│ ► 0:32:14 (in der Aufnahme) │
│ │
│ □ Überarbeitete Q4-Prognosen an das Team senden │
│ Zugewiesen an: Finanzteam · Fällig: Freitag │
│ ► 0:41:08 (in der Aufnahme) │
│ │
│ □ Folgemeeting für Dienstag planen │
│ Zugewiesen an: (nicht angegeben) · Keine Frist │
│ ► 0:43:55 (in der Aufnahme) │
└──────────────────────────────────────────────────────────┘
Jede Aktion umfasst:
- Die Aufgabe — was erledigt werden muss
- Verantwortlicher — wer darum gebeten wurde (falls erwähnt)
- Fälligkeitsdatum — wann es benötigt wird (falls erwähnt)
- Zeitstempel-Link — zu der Stelle in der Aufnahme springen, wo dies besprochen wurde
Hinweis: Die KI extrahiert Aktionen aus dem Gesagten. Wenn etwas besprochen wurde, ohne dass eine klare Zuweisung erfolgte, erscheint es möglicherweise hier oder nicht. Überprüfen Sie immer gegen die Aufnahme oder das Transkript.
Entscheidungen
Der Decisions-Tab listet die wichtigsten Entscheidungen und Vereinbarungen auf, die während der Aufnahme getroffen wurden.
┌──────────────────────────────────────────────────────────┐
│ Entscheidungen │
├──────────────────────────────────────────────────────────┤
│ ✓ 15% Reduzierung der Q4-Werbeausgaben genehmigt │
│ ► 0:32:14 │
│ │
│ ✓ Q3-Umsatzleistung als endgültig akzeptiert │
│ (keine Nachzählung) ► 0:12:45 │
│ │
│ ✓ Dienstags-Folgemeeting bestätigt ► 0:43:55 │
└──────────────────────────────────────────────────────────┘
Entscheidungen sind von Aktionen zu unterscheiden: Eine Entscheidung ist was vereinbart wurde, während eine Aktion was jemand als Ergebnis tun muss darstellt.
Kapitel
Der Chapters-Tab unterteilt die Aufnahme in zeitlich indexierte Themensegmente, wie Kapitel in einem Buch oder auf einer DVD.
┌──────────────────────────────────────────────────────────┐
│ Kapitel │
├──────────────────────────────────────────────────────────┤
│ ► 0:00:00 Einleitung & Organisatorisches 3 Min │
│ ► 0:03:10 Q3-Umsatzüberprüfung 12 Min │
│ ► 0:15:22 Ausgabenanalyse — Marketing 10 Min │
│ ► 0:25:41 Q4-Budgetvorschläge 18 Min │
│ ► 0:43:30 Abschluss & nächste Schritte 4 Min │
└──────────────────────────────────────────────────────────┘
Auf ein beliebiges Kapitel klicken springt der Player zur Startzeit dieses Themas. Wenn Sie nur die Diskussion über die Budgetvorschläge noch einmal anhören möchten, klicken Sie auf ► 0:25:41.
Kapitel sind besonders nützlich für lange Aufnahmen, bei denen Sie schnell ein bestimmtes Thema finden möchten.
KI-vorgeschlagene Dateiumbenennung
Nach Abschluss der KI-Extraktion kann die KI einen aussagekräftigeren Dateinamen für Ihre Aufnahme basierend auf dem Meeting-Inhalt vorschlagen. Ein Banner erscheint oben im AI-Insights-Feld:
┌──────────────────────────────────────────────────────────────┐
│ Neuer Dateiname: Q3-Budgetüberprüfung — Teammeeting 15. Okt │
│ [ Rename ] │
└──────────────────────────────────────────────────────────────┘
So wenden Sie den vorgeschlagenen Namen an:
- Klicken Sie auf Rename — die Aufnahmedatei und ihr Bibliothekseintrag werden sofort umbenannt.
- Das Vorschlags-Banner verschwindet nach der Umbenennung.
So behalten Sie Ihren ursprünglichen Namen:
- Ignorieren Sie das Banner — es wird nicht automatisch angewendet und verschwindet, wenn Sie wegnavigieren.
Hinweis: Der Vorschlag basiert auf dem Meeting-Inhalt. Bei einer generischen oder kurzen Aufnahme ähnelt der vorgeschlagene Name möglicherweise Ihrem Original. Sie haben immer das letzte Wort.
Gemini-Modellauswahl
SeaMeet ruft die verfügbaren Gemini-Modelle dynamisch von Googles API ab — die Modellliste bleibt aktuell, während Google neue Versionen veröffentlicht.
Welches Modell verwendet wird:
- SeaMeet filtert automatisch nach Modellen, die Text, Vision und Audio unterstützen (erforderlich für die Meeting-Analyse)
- Nur leistungsfähige, aktuelle Modelle werden angezeigt — ältere oder eingeschränkte Modelle werden ausgeschlossen
- Die Liste ist mit den neuesten/leistungsfähigsten Modellen zuerst sortiert
Sie können das aktive Modell unter Einstellungen → KI → Modell sehen und ändern. Der Standard ist das leistungsfähigste verfügbare Modell. Es gibt selten einen Grund, dies zu ändern, es sei denn, Sie möchten Kosten reduzieren oder eine spezifische Modellbeschränkung umgehen.
Screenshot-OCR — Automatisch Text extrahieren und in die Zwischenablage kopieren
Die KI-Extraktion beschränkt sich nicht auf Audioaufnahmen. Wenn Sie einen Screenshot mit der aktivierten Option „Extract text (OCR) and copy to clipboard" aufnehmen, führt SeaMeet automatisch OCR auf dem erfassten Bild aus und kopiert den extrahierten Text in die Zwischenablage.
So funktioniert es
- Vor der Aufnahme: Aktivieren Sie das Kontrollkästchen „Extract text (OCR) and copy to clipboard" in der Capture Hub oder im Bereichsselector-Overlay
- Screenshot aufnehmen (Vollbild oder Bereichserfassung)
- ~15–30 Sekunden warten — die KI-Pipeline verarbeitet das Bild im Hintergrund
- Text wird in die Zwischenablage kopiert — eine Benachrichtigung bestätigt „Extracted text copied to clipboard"
- Überall einfügen — Cmd+V / Ctrl+V fügt den extrahierten Text ein
Die OCR-Pipeline läuft vollständig im Hintergrund. Sie können SeaMeet weiter nutzen oder zu anderen Apps wechseln, während sie verarbeitet. Die Zwischenablage wird automatisch aktualisiert, wenn die Extraktion abgeschlossen ist.
Wo Sie die Einstellung finden
Die OCR-Auto-Kopieren-Option erscheint an drei Stellen:
| Ort | Was sie steuert |
|---|---|
| Capture Hub (Screenshot-Bereich) | Pro-Aufnahme-Umschalter — Kontrollkästchen unter der Modus-Auswahl |
| Bereichsselector-Overlay | Pro-Aufnahme-Umschalter — Kontrollkästchen neben „Capture Screen or Press Enter" |
| Einstellungen → KI-Extraktion & Zusammenfassung | Standard ein/aus — Umschalter „Text automatisch extrahieren (OCR) bei Screenshot" |
Alle drei Stellen bleiben synchron. Das Umschalten an einer Stelle aktualisiert die anderen.
Voraussetzungen
- Gemini-API-Schlüssel konfiguriert (oder aktives Abonnement mit verwaltetem Schlüssel)
- KI-Funktionen aktiviert in den Einstellungen
Wenn kein API-Schlüssel verfügbar ist, ist das Kontrollkästchen ausgegraut und zeigt „(API key required, subscribe here)" mit einem Link zum Abonnement-Portal.
Was extrahiert wird
Die OCR-Pipeline extrahiert sämtlichen sichtbaren Text aus dem Screenshot — darunter:
- UI-Beschriftungen, Menüs und Schaltflächen
- Dokument- und Webseiteninhalte
- Fehlermeldungen und Dialogtexte
- Code und Terminal-Ausgaben
- Handgeschriebener Text (falls lesbar)
Der extrahierte Text wird auch im KI-Extraktionsbereich des Screenshots unter dem Tab Text (OCR) gespeichert, sodass Sie ihn später einsehen oder erneut kopieren können.
Neu generieren
Wenn Sie mit den Ergebnissen nicht zufrieden sind oder nach dem Umbenennen von Sprechern eine neue Analyse wünschen, können Sie neu generieren.
-
Klicken Sie auf die Schaltfläche ⟳ (neu generieren) in der Tab-Leiste
- Was Sie sehen: Die Schaltfläche dreht sich. Ein kurzer "Processing…"-Hinweis ersetzt den Inhalt.
-
Warten Sie (gleiche Dauer wie die erste Generierung)
- Was Sie sehen: Alle fünf Tabs aktualisieren sich mit neuen Ergebnissen.
-
Überprüfen Sie die neuen Ergebnisse
Wichtig: Bevor Ihre Ergebnisse überschrieben werden, archiviert SeaMeet automatisch die vorherige Extraktion als Versions-Snapshot. Nichts geht jemals verloren. Sie können frühere Versionen jederzeit durchsuchen — siehe Kapitel 29, Teil B.
Exportieren
Die Tab-Leiste enthält Export-Schaltflächen, mit denen Sie die Ergebnisse aus SeaMeet herausnehmen können:
[Transcript] [Summary] [Actions] [Decisions] [Chapters] · [MD] [SRT] [JSON] [⟳]
| Schaltfläche | Format | Am besten für |
|---|---|---|
| MD | Markdown | Notiz-Apps (Notion, Obsidian), Dokumentation |
| SRT | SubRip-Untertitel | Untertitel zu Videodateien hinzufügen (iMovie, Premiere, YouTube) |
| JSON | JSON-Daten | Entwickler, Import in andere Tools |
Der aktive Tab bestimmt, was exportiert wird:
- Im Summary-Tab → MD exportiert den Zusammenfassungstext
- Im Transcript-Tab → SRT exportiert das Transkript mit Zeitstempeln als Untertitel
- Im Actions-Tab → MD oder JSON exportiert die Aktionspunkte-Liste
Tipp: Exportieren Sie vor dem Neu-Generieren, wenn Sie eine eigenständige Kopie der aktuellen Ergebnisse möchten — obwohl dies nicht unbedingt erforderlich ist, da der Versionsverlauf frühere Ergebnisse automatisch speichert (siehe Kapitel 29).
Fehlerbehebung
"Extraktion fehlgeschlagen"
Symptom: Der Ladeindikator stoppt und eine Fehlermeldung erscheint: "Extraction failed" oder "Something went wrong."
Versuchen Sie diese Schritte der Reihe nach:
- Überprüfen Sie Ihre Internetverbindung — versuchen Sie, eine Webseite zu laden
- Überprüfen Sie, ob Ihr API-Schlüssel noch gültig ist (Einstellungen → KI → grünes Häkchen suchen)
- Warten Sie 2–3 Minuten und versuchen Sie es erneut — der KI-Dienst ist möglicherweise vorübergehend überlastet
- Wenn die Aufnahme sehr lang ist (2+ Stunden), versuchen Sie, sie aufzuteilen, oder erlauben Sie mehr Verarbeitungszeit
"Die Zusammenfassung scheint unvollständig"
Symptom: Die Zusammenfassung ist kurz, fehlt wichtige Themen oder wirkt generisch.
Mögliche Ursachen:
- Audioqualität war schlecht — Transkriptionsfehler führen zu Extraktionsfehlern. Überprüfen Sie den Transcript-Tab auf unverständliche Segmente.
- Aufnahme erfasste zu wenig Stimme — wenn Systemaudio dominierte (Musik, Video-Wiedergabe), hatte die KI möglicherweise wenig Sprache, mit der sie arbeiten konnte
- Sehr kurze Aufnahme — Aufnahmen unter 2 Minuten erzeugen begrenzte Zusammenfassungen
Was Sie versuchen können:
- Führen Sie die Extraktion mit ⟳ erneut aus, nachdem Sie Sprecher umbenannt und das Transkript überprüft haben
- Verbessern Sie die Mikrofon-Platzierung für zukünftige Aufnahmen
"Aktionspunkte sind leer"
Symptom: Der Actions-Tab ist leer, obwohl in einem Meeting klar Aufgaben zugewiesen wurden.
Was passiert: Die KI extrahiert Aktionen aus expliziter Sprache ("Kannst du…", "Ich kümmere mich darum…", "Lassen Sie uns sicherstellen…"). Implizite oder informelle Verpflichtungen werden möglicherweise übersehen.
Was Sie versuchen können:
- Überprüfen Sie den Transcript-Tab — wenn das Gespräch informell war, hat die KI möglicherweise keine klare Aktionssprache identifiziert
- Dies ist das erwartete Verhalten für zwanglose, explorative Gespräche im Gegensatz zu strukturierten Meetings
Bewährte Praktiken
Höhere Audioqualität → bessere Ergebnisse Jeder Extraktionsschritt hängt von der Transkriptionsgenauigkeit ab. Eine Aufnahme mit einem Qualitätsmikrofon in einem ruhigen Raum erzeugt dramatisch bessere Ergebnisse als eine mit Hintergrundgeräuschen und Hall. Investieren Sie in ein ordentliches Headset-Mikrofon für regelmäßige Meeting-Aufnahmen.
Sowohl Mikrofon als auch Systemaudio aufnehmen Wenn Sie ein virtuelles Meeting aufnehmen (Zoom, Teams, Google Meet), verwenden Sie den Audio-Modus "Beides", damit das Systemaudio (andere Teilnehmer) zusammen mit Ihrem Mikrofon erfasst wird. Eine Extraktion aus einem einseitigen Gespräch erzeugt einseitige Ergebnisse.
Sprecher vor dem Neu-Generieren umbenennen Sprechernamen erscheinen in den Tabs Summary und Actions. "Speaker 1" in "Alice" umzubenennen, bevor Sie auf ⟳ klicken, erzeugt eine viel besser lesbare Zusammenfassung. Siehe Kapitel 29 zum Umbenennen von Sprechern.
Längere Aufnahmen erzeugen reichhaltigere Zusammenfassungen Ein 5-minütiges Meeting erzeugt eine kurze Zusammenfassung. Eine 45-minütige strategische Diskussion erzeugt eine detaillierte, strukturierte Zusammenfassung mit klaren Abschnitten. Die KI-Extraktion ist am wertvollsten für substanzielle Aufnahmen.
Kapitel zur Navigation verwenden Für Aufnahmen über 20 Minuten sollten Sie immer zuerst den Chapters-Tab prüfen. Er gibt Ihnen eine Übersicht der Diskussion, was es viel schneller macht, zum gewünschten Abschnitt zu springen.
Kurzübersicht
┌────────────────────────────────────────────────────────────┐
│ KI-EXTRAKTION │
│ Kurzübersicht │
├────────────────────────────────────────────────────────────┤
│ Auslösen │ AI-Insights-Tab → ✨ Generate Summary │
│ Neu generieren │ ⟳ Schaltfläche in Tab-Leiste │
│ Frühere Ergebn. │ Sicher archiviert — siehe Kap. 29 │
├────────────────────────────────────────────────────────────┤
│ Transcript │ Volltext + Zeitstempel, Klick = Sprung│
│ Summary │ Narrative Übersicht der Diskussion │
│ Actions │ Aufgaben + Verantwortliche + Fristen │
│ Decisions │ Vereinbarungen und Entscheidungen │
│ Chapters │ Zeitindexierte Themenübersicht │
├────────────────────────────────────────────────────────────┤
│ Export: MD │ Markdown — für Notiz-Apps │
│ Export: SRT │ Untertitel — für Videoeditoren │
│ Export: JSON │ Strukturierte Daten — für Entwickler │
├────────────────────────────────────────────────────────────┤
│ Screenshot OCR │ Auto-Text extrahieren + in Zwischenab.│
│ OCR-Einstellung │ Capture Hub-Kontrollk. od. Einst.→ KI│
├────────────────────────────────────────────────────────────┤
│ Benötigt │ Internet + KI-Funktionen + API-Schlüs.│
│ Funktioniert mit │ Jeder Aufnahme oder jedem Screenshot │
└────────────────────────────────────────────────────────────┘
Zuletzt aktualisiert: 2026-03-27
← Kapitel 27: Live-Transkription | Kapitel 29: KI-Ergebnisse bearbeiten →
Published: