Rozdział 28: Ekstrakcja AI — Pozwól SeaMeet Robić Notatki

Wyobraź sobie asystenta, który uczestniczy w każdym spotkaniu, pisze podsumowanie, zbiera elementy akcji, zaznacza kluczowe decyzje i dodaje znaczniki czasu przy każdej zmianie tematu — podczas gdy Ty skupiasz się tylko na rozmowie. Właśnie to robi Ekstrakcja AI. Skieruj ją na dowolne nagranie w swojej bibliotece, a zwróci pięć ustrukturyzowanych wyników: pełną transkrypcję, zwięzłe podsumowanie, elementy akcji, kluczowe decyzje i rozdziały ze znacznikami czasu.

Bez pisania. Bez przewijania. Bez zgadywania, co zostało postanowione.

Cele Rozdziału

Po przeczytaniu tego rozdziału będziesz w stanie:

Zrozumieć, co produkuje Ekstrakcja AI i kiedy jej używać
Skonfigurować wymagania wstępne
Wygenerować swoją pierwszą ekstrakcję
Nawigować i używać każdej z pięciu kart wyjściowych
Używać OCR zrzutów ekranu do automatycznego wyodrębniania tekstu i kopiowania go do schowka
Regenerować wyniki i rozumieć, jak poprzednie wersje są zachowywane
Eksportować wyniki w wielu formatach
Rozwiązywać typowe problemy z ekstrakcją

Czym Jest Ekstrakcja AI?

Ekstrakcja AI to proces analizy po Nagraniu. Po ukończeniu nagrania uruchamiasz ją jednym kliknięciem. Silnik AI przetwarza audio i zwraca pięć ustrukturyzowanych wyników:

Karta	Co zawiera
Transkrypcja	Tekst słowo w słowo ze znacznikami czasu z wszystkiego, co zostało powiedziane
Podsumowanie	Zwięzłe streszczenie tego, co było omawiane
Działania	Zadania zidentyfikowane w rozmowie, z przypisaniem i terminami tam, gdzie były wspomniane
Decyzje	Kluczowe wybory podjęte podczas spotkania
Rozdziały	Segmenty tematyczne z indeksem czasowym — jak rozdziały w książce

Pomyśl o tym tak: Nagranie to surowy materiał. Ekstrakcja AI to montażysta, który go ogląda i przekształca w coś ustrukturyzowanego i użytecznego.

Ekstrakcja AI działa na dowolnym nagraniu w Twojej bibliotece — niezależnie od tego, czy podczas nagrania korzystałeś z Transkrypcji na żywo. Jeśli Transkrypcja na żywo była aktywna, Ekstrakcja może nadal służyć jako użyteczny drugi przebieg, produkując podsumowania i ustrukturyzowane wyniki, których sama Transkrypcja na żywo nie zapewnia.

Zanim Zaczniesz

Wymagania

Funkcje AI włączone: Ustawienia → AI → włącz
Skonfigurowany Klucz API: Ustawienia → AI → pole Klucz API (zielony ptaszek = prawidłowy)
Aktywne połączenie internetowe podczas ekstrakcji
Nagranie w bibliotece — dowolny plik audio lub wideo nagrany lub zaimportowany przez SeaMeet

Jak długo trwa ekstrakcja?

Czas przetwarzania skaluje się z długością nagrania:

Długość nagrania	Przybliżony czas
Poniżej 15 minut	20–40 sekund
15–60 minut	1–3 minuty
1–2 godziny	3–6 minut
Powyżej 2 godzin	5–10 minut

To są szacunki. Rzeczywisty czas zależy od obciążenia serwera i prędkości Twojego internetu.

Generowanie Pierwszej Ekstrakcji

Otwórz nagranie z biblioteki nagrań
- Co widzisz: Panel szczegółów nagrania otwiera się po prawej stronie, pokazując odtwarzacz i informacje o nagraniu.
Kliknij kartę AI Insights w panelu szczegółów
- Co widzisz: Pojawia się panel AI Insights z monitem "Generate Summary", jeśli żadna ekstrakcja nie była jeszcze uruchomiana. Przycisk oznaczony jest ikoną ✨.
Kliknij ✨ Generate Summary
- Co widzisz: Etykieta przycisku zmienia się na spinner. Pasek postępu lub komunikat o statusie ("Analizowanie audio…", "Generowanie podsumowania…") aktualizuje się w trakcie pracy AI.
Poczekaj na wyniki
- Co widzisz: Po ukończeniu pięć kart wypełnia się treścią. Pasek kart w górnej części panelu AI Insights pokazuje: Transkrypcja · Podsumowanie · Działania · Decyzje · Rozdziały.
Przeglądaj karty (patrz sekcje poniżej, co szukać w każdej z nich)

Zrozumienie Każdej Karty

Transkrypcja

Karta Transkrypcja pokazuje kompletny tekst słowo w słowo nagrania, podzielony na segmenty ze znacznikami czasu i etykietami mówców.

┌──────────────────────────────────────────────────────────┐
│  Transkrypcja  │  Podsumowanie  │  Działania  │  Decyzje  │  Rozdziały │
├──────────────────────────────────────────────────────────┤
│  Mówca 1   ► 0:00:08                                      │
│  "Dzień dobry wszystkim. Zacznijmy od                     │
│   przeglądu budżetu Q3."                                  │
│                                                          │
│  Mówca 2   ► 0:00:21                                      │
│  "Dziękuję. Przygotowałem slajdy. Czy zaczynamy           │
│   od przychodów czy wydatków?"                            │
│                                                          │
│  Mówca 1   ► 0:00:30                                      │
│  "Najpierw przychody. Alice, czy możesz nam to omówić?"   │
└──────────────────────────────────────────────────────────┘

Kliknięcie znacznika czasu (link ► 0:00:08 obok każdego segmentu) przesuwa odtwarzacz audio/wideo do dokładnie tego momentu. Ułatwia to weryfikację cytatu lub znalezienie konkretnej dyskusji bez ręcznego przewijania.

Etykiety mówców domyślnie mają nazwy "Mówca 1", "Mówca 2" itd. Możesz je zmienić — patrz Rozdział 29.

Podsumowanie

Karta Podsumowanie zawiera zwięzłe streszczenie tego, co wydarzyło się w nagraniu. Nie jest to lista punktów z przetranscribowanymi słowami — to syntetyczny przegląd, który uchwytuje główne omawiane kwestie.

Przykład (dla 45-minutowego spotkania budżetowego):

Zespół przejrzał wyniki przychodów w Q3, które wyniosły 8% powyżej prognozy. Przekroczenia wydatków w budżecie marketingowym zostały zidentyfikowane jako główna obawa wchodząc w Q4. Alice zaproponowała 15% redukcję wydatków na reklamy płatne, która została zaakceptowana z zastrzeżeniem ostatecznej zgody ze strony finansów. Grupa zgodziła się zebrać ponownie w następny wtorek, aby przejrzeć zrewidowane prognozy.

Podsumowanie jest zaprojektowane do udostępniania — możesz je skopiować do e-maila, narzędzia do zarządzania projektami lub dokumentu bez edycji.

Działania

Karta Działania zawiera listę zadań, które zostały jawnie lub niejawnie przypisane podczas nagrania.

┌──────────────────────────────────────────────────────────┐
│  Działania                                               │
├──────────────────────────────────────────────────────────┤
│  □  Zredukować wydatki na reklamy płatne o 15%           │
│     Przypisano do: Alice  ·  Termin: Przed wtorkowym spotkaniem │
│     ► 0:32:14 (w nagraniu)                               │
│                                                          │
│  □  Wysłać zrewidowane prognozy Q4 do zespołu            │
│     Przypisano do: Zespół finansowy  ·  Termin: Piątek   │
│     ► 0:41:08 (w nagraniu)                               │
│                                                          │
│  □  Zaplanować spotkanie uzupełniające na wtorek         │
│     Przypisano do: (nieokreślone)  ·  Brak terminu       │
│     ► 0:43:55 (w nagraniu)                               │
└──────────────────────────────────────────────────────────┘

Każde działanie zawiera:

Zadanie — co trzeba zrobić
Przypisanie — kto został poproszony o wykonanie (jeśli wspomniano)
Termin — kiedy jest potrzebne (jeśli wspomniano)
Link do znacznika czasu — przejdź do miejsca w nagraniu, gdzie to było omawiane

Uwaga: AI wyciąga działania z tego, co zostało powiedziane. Jeśli coś było omawiane, ale nie dokonano wyraźnego przypisania, może lub nie może się tu pojawić. Zawsze weryfikuj na podstawie nagrania lub transkrypcji.

Decyzje

Karta Decyzje zawiera listę kluczowych wyborów i porozumień osiągniętych podczas nagrania.

┌──────────────────────────────────────────────────────────┐
│  Decyzje                                                 │
├──────────────────────────────────────────────────────────┤
│  ✓  Zatwierdzona 15% redukcja wydatków na reklamy płatne Q4 │
│     ► 0:32:14                                            │
│                                                          │
│  ✓  Wyniki przychodów Q3 zaakceptowane jako ostateczne (brak przeliczenia) │
│     ► 0:12:45                                            │
│                                                          │
│  ✓  Wtorkowe spotkanie uzupełniające potwierdzone        │
│     ► 0:43:55                                            │
└──────────────────────────────────────────────────────────┘

Decyzje różnią się od działań: decyzja to co zostało uzgodnione, podczas gdy działanie to co ktoś musi zrobić w rezultacie.

Rozdziały

Karta Rozdziały dzieli nagranie na segmenty tematyczne z indeksem czasowym, jak rozdziały w książce lub rozdziały na DVD.

┌──────────────────────────────────────────────────────────┐
│  Rozdziały                                               │
├──────────────────────────────────────────────────────────┤
│  ► 0:00:00  Wprowadzenie i kwestie organizacyjne    3 min │
│  ► 0:03:10  Przegląd Przychodów Q3                 12 min │
│  ► 0:15:22  Analiza wydatków — Marketing           10 min │
│  ► 0:25:41  Propozycje Budżetu Q4                  18 min │
│  ► 0:43:30  Podsumowanie i kolejne kroki            4 min │
└──────────────────────────────────────────────────────────┘

Kliknięcie dowolnego rozdziału przesuwa odtwarzacz do czasu rozpoczęcia tego tematu. Jeśli chcesz odsłuchać tylko dyskusję o propozycjach budżetowych, kliknij ► 0:25:41.

Rozdziały są szczególnie przydatne dla długich nagrań, gdzie chcesz szybko znaleźć konkretny temat.

Sugestia Zmiany Nazwy Pliku przez AI

Po zakończeniu Ekstrakcji AI, AI może zasugerować bardziej opisową nazwę pliku dla Twojego nagrania na podstawie treści spotkania. W górnej części panelu AI Insights pojawia się baner:

┌──────────────────────────────────────────────────────────────┐
│  Nowa nazwa pliku: Q3 Budget Review — Oct 15 Team Meeting    │
│                                              [ Rename ]      │
└──────────────────────────────────────────────────────────────┘

Aby zastosować sugerowaną nazwę:

Kliknij Rename — plik nagrania i jego wpis w bibliotece są natychmiast przemianowane.
Baner sugestii znika po zmianie nazwy.

Aby zachować oryginalną nazwę:

Zignoruj baner — nie stosuje się automatycznie i znika po przejściu do innego miejsca.

Uwaga: Sugestia jest oparta na treści spotkania. Dla generycznego lub krótkiego nagrania sugerowana nazwa może być podobna do oryginału. Zawsze masz ostatnie słowo.

Wybór Modelu Gemini

SeaMeet pobiera dostępne modele Gemini z API Google dynamicznie — lista modeli jest aktualizowana na bieżąco, gdy Google wydaje nowe wersje.

Który model jest używany:

SeaMeet automatycznie filtruje modele obsługujące tekst, wizję i audio (wymagane do analizy spotkań)
Pokazywane są tylko sprawne, aktualne modele — starsze lub ograniczone modele są wykluczone
Lista jest posortowana od najnowszych/najbardziej sprawnych modeli

Możesz zobaczyć i zmienić aktywny model w Ustawienia → AI → Model. Domyślny jest najbardziej sprawny dostępny model. Rzadko jest powód do zmiany, chyba że musisz obniżyć koszty lub obejść konkretne ograniczenie modelu.

OCR Zrzutów Ekranu — Automatyczne Wyodrębnianie Tekstu i Kopiowanie do Schowka

Ekstrakcja AI nie ogranicza się do nagrań audio. Gdy robisz zrzut ekranu z włączoną opcją "Extract text (OCR) and copy to clipboard", SeaMeet automatycznie uruchamia OCR na przechwyconym obrazie i kopiuje wyodrębniony tekst do schowka.

Jak to działa

Przed przechwyceniem: Zaznacz pole "Extract text (OCR) and copy to clipboard" w Capture Hub lub nakładce Selektora regionu
Zrób zrzut ekranu (Full Screen lub Area Capture)
Poczekaj ~15–30 sekund — pipeline AI przetwarza obraz w tle
Tekst jest kopiowany do schowka — powiadomienie potwierdza "Extracted text copied to clipboard"
Wklej gdziekolwiek — Cmd+V / Ctrl+V, aby wkleić wyodrębniony tekst

Pipeline OCR działa w pełni w tle. Możesz kontynuować korzystanie z SeaMeet lub przejść do innych aplikacji podczas przetwarzania. Schowek jest aktualizowany automatycznie po zakończeniu ekstrakcji.

Gdzie znaleźć ustawienie

Opcja automatycznego kopiowania OCR pojawia się w trzech miejscach:

Lokalizacja	Co kontroluje
Capture Hub (Panel zrzutu ekranu)	Przełącznik na przechwycenie — pole wyboru pod selektorem trybu przechwytywania
Selektor regionu nakładka	Przełącznik na przechwycenie — pole wyboru obok "Capture Screen or Press Enter"
Ustawienia → AI Extraction & Summary	Domyślne włączenie/wyłączenie — przełącznik "Auto-extract text (OCR) on screenshot"

Wszystkie trzy lokalizacje są zsynchronizowane. Przełączanie w dowolnej lokalizacji aktualizuje pozostałe.

Wymagania

Skonfigurowany Klucz API Gemini (lub aktywna subskrypcja z zarządzanym kluczem)
Funkcje AI włączone w Ustawieniach

Jeśli Klucz API nie jest dostępny, pole wyboru jest wyszarzone i wyświetla "(API key required, subscribe here)" z linkiem do portalu subskrypcji.

Co jest wyodrębniane

Pipeline OCR wyodrębnia cały widoczny tekst ze zrzutu ekranu — w tym:

Etykiety interfejsu, menu i przyciski
Treść dokumentów i stron internetowych
Komunikaty o błędach i tekst okien dialogowych
Kod i wyjście terminala
Tekst pisany odręcznie (jeśli czytelny)

Wyodrębniony tekst jest również zapisywany w panelu Ekstrakcji AI zrzutu ekranu na karcie Text (OCR), dzięki czemu możesz go przejrzeć lub ponownie skopiować później.

Regeneracja

Jeśli nie jesteś zadowolony z wyników lub chcesz nową analizę po zmianie nazw mówców, możesz zregenerować.

Kliknij przycisk ⟳ (regeneruj) w pasku kart
- Co widzisz: Przycisk obraca się. Krótkie powiadomienie "Przetwarzanie…" zastępuje treść.
Poczekaj (ten sam czas co przy początkowej generacji)
- Co widzisz: Wszystkie pięć kart odświeża się nowymi wynikami.
Przejrzyj nowe wyniki

Ważne: Przed nadpisaniem wyników SeaMeet automatycznie archiwizuje poprzednią ekstrakcję jako snapshot wersji. Nic nie jest nigdy tracone. Możesz przeglądać poprzednie wersje w dowolnym momencie — patrz Rozdział 29, Część B.

Eksport

Pasek kart zawiera przyciski eksportu umożliwiające przeniesienie wyników poza SeaMeet:

[Transkrypcja] [Podsumowanie] [Działania] [Decyzje] [Rozdziały]  ·  [MD] [SRT] [JSON] [⟳]

Przycisk	Format	Najlepszy do
MD	Markdown	Aplikacje do notatek (Notion, Obsidian), dokumentacja
SRT	Napisy SubRip	Dodawanie napisów do plików wideo (iMovie, Premiere, YouTube)
JSON	Dane JSON	Deweloperzy, importowanie do innych narzędzi

Aktywna karta określa, co jest eksportowane:

Na karcie Podsumowanie → MD eksportuje tekst podsumowania
Na karcie Transkrypcja → SRT eksportuje transkrypcję ze znacznikami czasu jako napisy
Na karcie Działania → MD lub JSON eksportuje listę elementów działań

Wskazówka: Eksportuj przed regeneracją, jeśli chcesz autonomiczną kopię bieżących wyników — choć nie jest to ściśle konieczne, ponieważ historia wersji automatycznie zachowuje poprzednie wyniki (patrz Rozdział 29).

Rozwiązywanie Problemów

"Ekstrakcja nie powiodła się"

Objaw: Spinner zatrzymuje się i pojawia się komunikat o błędzie: "Extraction failed" lub "Something went wrong."

Spróbuj po kolei:

Sprawdź połączenie internetowe — spróbuj załadować stronę internetową
Sprawdź, czy Twój Klucz API jest nadal prawidłowy (Ustawienia → AI → poszukaj zielonego ptaszka)
Poczekaj 2–3 minuty i spróbuj ponownie — usługa AI może być tymczasowo przeciążona
Jeśli nagranie jest bardzo długie (2+ godziny), spróbuj je podzielić lub daj więcej czasu na przetwarzanie

"Podsumowanie wydaje się niekompletne"

Objaw: Podsumowanie jest krótkie, pomija kluczowe tematy lub wydaje się generyczne.

Możliwe przyczyny:

Jakość audio była słaba — błędy transkrypcji prowadzą do błędów ekstrakcji. Sprawdź kartę Transkrypcja pod kątem niezrozumiałych segmentów.
Nagranie uchwyciło zbyt mało głosu — jeśli audio systemu dominowało (muzyka, odtwarzanie wideo), AI mogła mieć mało mowy do przetworzenia
Bardzo krótkie nagranie — nagrania poniżej 2 minut produkują ograniczone podsumowania

Co spróbować:

Uruchom ponownie ekstrakcję za pomocą ⟳ po zmianie nazw mówców i przejrzeniu transkrypcji
Popraw umiejscowienie Mikrofonu przy przyszłych nagraniach

"Elementy działań są puste"

Objaw: Karta Działania jest pusta nawet po spotkaniu, na którym wyraźnie przypisano zadania.

Co się dzieje: AI wyciąga działania z jawnego języka ("Czy możesz…", "Zajmę się tym…", "Upewnijmy się, że…"). Niejawne lub nieformalne zobowiązania mogą zostać pominięte.

Co spróbować:

Sprawdź kartę Transkrypcja — jeśli rozmowa była nieformalna, AI mogła nie zidentyfikować wyraźnego języka działań
To oczekiwane zachowanie dla swobodnych, eksploracyjnych rozmów, a nie ustrukturyzowanych spotkań

Najlepsze Praktyki

Wyższa jakość audio → lepsze wyniki Każdy etap ekstrakcji zależy od dokładności transkrypcji. Nagranie wykonane wysokiej jakości Mikrofonem w cichym pokoju da dramatycznie lepsze wyniki niż nagranie z hałasem w tle i echem. Zainwestuj w dobry Mikrofon w zestawie słuchawkowym do regularnych nagrań spotkań.

Nagrywaj zarówno Mikrofon, jak i audio systemu Jeśli nagrywasz wirtualne spotkanie (Zoom, Teams, Google Meet), użyj trybu audio "Oba", aby audio systemu (inni uczestnicy) było rejestrowane razem z Twoim Mikrofonem. Ekstrakcja z jednostronnej rozmowy daje jednostronne wyniki.

Zmień nazwy mówców przed regeneracją Nazwy mówców pojawiają się w kartach Podsumowanie i Działania. Zmiana "Mówca 1" na "Alice" przed kliknięciem ⟳ daje znacznie bardziej czytelne podsumowanie. Patrz Rozdział 29, jak zmieniać nazwy mówców.

Dłuższe nagrania dają bogatsze podsumowania Pięciominutowe spotkanie da krótkie podsumowanie. 45-minutowa dyskusja strategiczna da szczegółowe, ustrukturyzowane podsumowanie z wyraźnymi sekcjami. Ekstrakcja AI jest najbardziej wartościowa dla merytorycznych nagrań.

Używaj Rozdziałów do nawigacji W przypadku nagrań powyżej 20 minut zawsze najpierw sprawdzaj kartę Rozdziały. Daje Ci mapę dyskusji, znacznie przyspieszając przejście do interesującej Cię sekcji.

Szybka Dokumentacja

┌────────────────────────────────────────────────────────────┐
│                     EKSTRAKCJA AI                          │
│                    Szybka Dokumentacja                     │
├────────────────────────────────────────────────────────────┤
│  Uruchom           │ Karta AI Insights → ✨ Generate Summary │
│  Regeneruj         │ Przycisk ⟳ w pasku kart               │
│  Poprzednie wyniki │ Bezpiecznie zarchiwizowane — patrz Rozdz. 29 │
├────────────────────────────────────────────────────────────┤
│  Transkrypcja      │ Pełny tekst + znaczniki czasu, kliknij aby przejść │
│  Podsumowanie      │ Narracyjny przegląd dyskusji           │
│  Działania         │ Zadania + przypisania + terminy        │
│  Decyzje           │ Uzgodnienia i podjęte wybory           │
│  Rozdziały         │ Mapa tematyczna z indeksem czasu, kliknij aby przejść │
├────────────────────────────────────────────────────────────┤
│  Eksport: MD       │ Markdown — do aplikacji z notatkami   │
│  Eksport: SRT      │ Napisy — do edytorów wideo            │
│  Eksport: JSON     │ Dane strukturalne — dla deweloperów   │
├────────────────────────────────────────────────────────────┤
│  Screenshot OCR    │ Auto-wyodrębnianie tekstu + kopia do  │
│                    │ schowka                               │
│  Ustawienie OCR    │ Pole wyboru Capture Hub lub            │
│                    │ Ustawienia → AI                       │
├────────────────────────────────────────────────────────────┤
│  Wymaga            │ Internet + Funkcje AI włączone + Klucz API │
│  Działa na         │ Dowolnym nagraniu lub zrzucie ekranu  │
└────────────────────────────────────────────────────────────┘

Ostatnia aktualizacja: 2026-03-27

← Rozdział 27: Transkrypcja na Żywo | Rozdział 29: Edytowanie Wyników AI →

Ekstrakcja AI - Pozwól SeaMeet Robić Notatki

Rozdział 28: Ekstrakcja AI — Pozwól SeaMeet Robić Notatki

Cele Rozdziału

Czym Jest Ekstrakcja AI?

Zanim Zaczniesz

Wymagania

Jak długo trwa ekstrakcja?

Generowanie Pierwszej Ekstrakcji

Zrozumienie Każdej Karty

Transkrypcja

Podsumowanie

Działania

Decyzje

Rozdziały

Sugestia Zmiany Nazwy Pliku przez AI

Wybór Modelu Gemini

OCR Zrzutów Ekranu — Automatyczne Wyodrębnianie Tekstu i Kopiowanie do Schowka

Jak to działa

Gdzie znaleźć ustawienie

Wymagania

Co jest wyodrębniane

Regeneracja

Eksport

Rozwiązywanie Problemów

"Ekstrakcja nie powiodła się"

"Podsumowanie wydaje się niekompletne"

"Elementy działań są puste"

Najlepsze Praktyki

Szybka Dokumentacja