Ekstrakcja AI - Pozwól SeaMeet Robić Notatki
Rozdział 28: Ekstrakcja AI — Pozwól SeaMeet Robić Notatki
Wyobraź sobie asystenta, który uczestniczy w każdym spotkaniu, pisze podsumowanie, zbiera elementy akcji, zaznacza kluczowe decyzje i dodaje znaczniki czasu przy każdej zmianie tematu — podczas gdy Ty skupiasz się tylko na rozmowie. Właśnie to robi Ekstrakcja AI. Skieruj ją na dowolne nagranie w swojej bibliotece, a zwróci pięć ustrukturyzowanych wyników: pełną transkrypcję, zwięzłe podsumowanie, elementy akcji, kluczowe decyzje i rozdziały ze znacznikami czasu.
Bez pisania. Bez przewijania. Bez zgadywania, co zostało postanowione.
Cele Rozdziału
Po przeczytaniu tego rozdziału będziesz w stanie:
- Zrozumieć, co produkuje Ekstrakcja AI i kiedy jej używać
- Skonfigurować wymagania wstępne
- Wygenerować swoją pierwszą ekstrakcję
- Nawigować i używać każdej z pięciu kart wyjściowych
- Używać OCR zrzutów ekranu do automatycznego wyodrębniania tekstu i kopiowania go do schowka
- Regenerować wyniki i rozumieć, jak poprzednie wersje są zachowywane
- Eksportować wyniki w wielu formatach
- Rozwiązywać typowe problemy z ekstrakcją
Czym Jest Ekstrakcja AI?
Ekstrakcja AI to proces analizy po Nagraniu. Po ukończeniu nagrania uruchamiasz ją jednym kliknięciem. Silnik AI przetwarza audio i zwraca pięć ustrukturyzowanych wyników:
| Karta | Co zawiera |
|---|---|
| Transkrypcja | Tekst słowo w słowo ze znacznikami czasu z wszystkiego, co zostało powiedziane |
| Podsumowanie | Zwięzłe streszczenie tego, co było omawiane |
| Działania | Zadania zidentyfikowane w rozmowie, z przypisaniem i terminami tam, gdzie były wspomniane |
| Decyzje | Kluczowe wybory podjęte podczas spotkania |
| Rozdziały | Segmenty tematyczne z indeksem czasowym — jak rozdziały w książce |
Pomyśl o tym tak: Nagranie to surowy materiał. Ekstrakcja AI to montażysta, który go ogląda i przekształca w coś ustrukturyzowanego i użytecznego.
Ekstrakcja AI działa na dowolnym nagraniu w Twojej bibliotece — niezależnie od tego, czy podczas nagrania korzystałeś z Transkrypcji na żywo. Jeśli Transkrypcja na żywo była aktywna, Ekstrakcja może nadal służyć jako użyteczny drugi przebieg, produkując podsumowania i ustrukturyzowane wyniki, których sama Transkrypcja na żywo nie zapewnia.
Zanim Zaczniesz
Wymagania
- Funkcje AI włączone: Ustawienia → AI → włącz
- Skonfigurowany Klucz API: Ustawienia → AI → pole Klucz API (zielony ptaszek = prawidłowy)
- Aktywne połączenie internetowe podczas ekstrakcji
- Nagranie w bibliotece — dowolny plik audio lub wideo nagrany lub zaimportowany przez SeaMeet
Jak długo trwa ekstrakcja?
Czas przetwarzania skaluje się z długością nagrania:
| Długość nagrania | Przybliżony czas |
|---|---|
| Poniżej 15 minut | 20–40 sekund |
| 15–60 minut | 1–3 minuty |
| 1–2 godziny | 3–6 minut |
| Powyżej 2 godzin | 5–10 minut |
To są szacunki. Rzeczywisty czas zależy od obciążenia serwera i prędkości Twojego internetu.
Generowanie Pierwszej Ekstrakcji
-
Otwórz nagranie z biblioteki nagrań
- Co widzisz: Panel szczegółów nagrania otwiera się po prawej stronie, pokazując odtwarzacz i informacje o nagraniu.
-
Kliknij kartę AI Insights w panelu szczegółów
- Co widzisz: Pojawia się panel AI Insights z monitem "Generate Summary", jeśli żadna ekstrakcja nie była jeszcze uruchomiana. Przycisk oznaczony jest ikoną ✨.
-
Kliknij ✨ Generate Summary
- Co widzisz: Etykieta przycisku zmienia się na spinner. Pasek postępu lub komunikat o statusie ("Analizowanie audio…", "Generowanie podsumowania…") aktualizuje się w trakcie pracy AI.
-
Poczekaj na wyniki
- Co widzisz: Po ukończeniu pięć kart wypełnia się treścią. Pasek kart w górnej części panelu AI Insights pokazuje: Transkrypcja · Podsumowanie · Działania · Decyzje · Rozdziały.
-
Przeglądaj karty (patrz sekcje poniżej, co szukać w każdej z nich)
Zrozumienie Każdej Karty
Transkrypcja
Karta Transkrypcja pokazuje kompletny tekst słowo w słowo nagrania, podzielony na segmenty ze znacznikami czasu i etykietami mówców.
┌──────────────────────────────────────────────────────────┐
│ Transkrypcja │ Podsumowanie │ Działania │ Decyzje │ Rozdziały │
├──────────────────────────────────────────────────────────┤
│ Mówca 1 ► 0:00:08 │
│ "Dzień dobry wszystkim. Zacznijmy od │
│ przeglądu budżetu Q3." │
│ │
│ Mówca 2 ► 0:00:21 │
│ "Dziękuję. Przygotowałem slajdy. Czy zaczynamy │
│ od przychodów czy wydatków?" │
│ │
│ Mówca 1 ► 0:00:30 │
│ "Najpierw przychody. Alice, czy możesz nam to omówić?" │
└──────────────────────────────────────────────────────────┘
Kliknięcie znacznika czasu (link ► 0:00:08 obok każdego segmentu) przesuwa odtwarzacz audio/wideo do dokładnie tego momentu. Ułatwia to weryfikację cytatu lub znalezienie konkretnej dyskusji bez ręcznego przewijania.
Etykiety mówców domyślnie mają nazwy "Mówca 1", "Mówca 2" itd. Możesz je zmienić — patrz Rozdział 29.
Podsumowanie
Karta Podsumowanie zawiera zwięzłe streszczenie tego, co wydarzyło się w nagraniu. Nie jest to lista punktów z przetranscribowanymi słowami — to syntetyczny przegląd, który uchwytuje główne omawiane kwestie.
Przykład (dla 45-minutowego spotkania budżetowego):
Zespół przejrzał wyniki przychodów w Q3, które wyniosły 8% powyżej prognozy. Przekroczenia wydatków w budżecie marketingowym zostały zidentyfikowane jako główna obawa wchodząc w Q4. Alice zaproponowała 15% redukcję wydatków na reklamy płatne, która została zaakceptowana z zastrzeżeniem ostatecznej zgody ze strony finansów. Grupa zgodziła się zebrać ponownie w następny wtorek, aby przejrzeć zrewidowane prognozy.
Podsumowanie jest zaprojektowane do udostępniania — możesz je skopiować do e-maila, narzędzia do zarządzania projektami lub dokumentu bez edycji.
Działania
Karta Działania zawiera listę zadań, które zostały jawnie lub niejawnie przypisane podczas nagrania.
┌──────────────────────────────────────────────────────────┐
│ Działania │
├──────────────────────────────────────────────────────────┤
│ □ Zredukować wydatki na reklamy płatne o 15% │
│ Przypisano do: Alice · Termin: Przed wtorkowym spotkaniem │
│ ► 0:32:14 (w nagraniu) │
│ │
│ □ Wysłać zrewidowane prognozy Q4 do zespołu │
│ Przypisano do: Zespół finansowy · Termin: Piątek │
│ ► 0:41:08 (w nagraniu) │
│ │
│ □ Zaplanować spotkanie uzupełniające na wtorek │
│ Przypisano do: (nieokreślone) · Brak terminu │
│ ► 0:43:55 (w nagraniu) │
└──────────────────────────────────────────────────────────┘
Każde działanie zawiera:
- Zadanie — co trzeba zrobić
- Przypisanie — kto został poproszony o wykonanie (jeśli wspomniano)
- Termin — kiedy jest potrzebne (jeśli wspomniano)
- Link do znacznika czasu — przejdź do miejsca w nagraniu, gdzie to było omawiane
Uwaga: AI wyciąga działania z tego, co zostało powiedziane. Jeśli coś było omawiane, ale nie dokonano wyraźnego przypisania, może lub nie może się tu pojawić. Zawsze weryfikuj na podstawie nagrania lub transkrypcji.
Decyzje
Karta Decyzje zawiera listę kluczowych wyborów i porozumień osiągniętych podczas nagrania.
┌──────────────────────────────────────────────────────────┐
│ Decyzje │
├──────────────────────────────────────────────────────────┤
│ ✓ Zatwierdzona 15% redukcja wydatków na reklamy płatne Q4 │
│ ► 0:32:14 │
│ │
│ ✓ Wyniki przychodów Q3 zaakceptowane jako ostateczne (brak przeliczenia) │
│ ► 0:12:45 │
│ │
│ ✓ Wtorkowe spotkanie uzupełniające potwierdzone │
│ ► 0:43:55 │
└──────────────────────────────────────────────────────────┘
Decyzje różnią się od działań: decyzja to co zostało uzgodnione, podczas gdy działanie to co ktoś musi zrobić w rezultacie.
Rozdziały
Karta Rozdziały dzieli nagranie na segmenty tematyczne z indeksem czasowym, jak rozdziały w książce lub rozdziały na DVD.
┌──────────────────────────────────────────────────────────┐
│ Rozdziały │
├──────────────────────────────────────────────────────────┤
│ ► 0:00:00 Wprowadzenie i kwestie organizacyjne 3 min │
│ ► 0:03:10 Przegląd Przychodów Q3 12 min │
│ ► 0:15:22 Analiza wydatków — Marketing 10 min │
│ ► 0:25:41 Propozycje Budżetu Q4 18 min │
│ ► 0:43:30 Podsumowanie i kolejne kroki 4 min │
└────────────────────────────── ────────────────────────────┘
Kliknięcie dowolnego rozdziału przesuwa odtwarzacz do czasu rozpoczęcia tego tematu. Jeśli chcesz odsłuchać tylko dyskusję o propozycjach budżetowych, kliknij ► 0:25:41.
Rozdziały są szczególnie przydatne dla długich nagrań, gdzie chcesz szybko znaleźć konkretny temat.
Sugestia Zmiany Nazwy Pliku przez AI
Po zakończeniu Ekstrakcji AI, AI może zasugerować bardziej opisową nazwę pliku dla Twojego nagrania na podstawie treści spotkania. W górnej części panelu AI Insights pojawia się baner:
┌──────────────────────────────────────────────────────────────┐
│ Nowa nazwa pliku: Q3 Budget Review — Oct 15 Team Meeting │
│ [ Rename ] │
└──────────────────────────────────────────────────────────────┘
Aby zastosować sugerowaną nazwę:
- Kliknij Rename — plik nagrania i jego wpis w bibliotece są natychmiast przemianowane.
- Baner sugestii znika po zmianie nazwy.
Aby zachować oryginalną nazwę:
- Zignoruj baner — nie stosuje się automatycznie i znika po przejściu do innego miejsca.
Uwaga: Sugestia jest oparta na treści spotkania. Dla generycznego lub krótkiego nagrania sugerowana nazwa może być podobna do oryginału. Zawsze masz ostatnie słowo.
Wybór Modelu Gemini
SeaMeet pobiera dostępne modele Gemini z API Google dynamicznie — lista modeli jest aktualizowana na bieżąco, gdy Google wydaje nowe wersje.
Który model jest używany:
- SeaMeet automatycznie filtruje modele obsługujące tekst, wizję i audio (wymagane do analizy spotkań)
- Pokazywane są tylko sprawne, aktualne modele — starsze lub ograniczone modele są wykluczone
- Lista jest posortowana od najnowszych/najbardziej sprawnych modeli
Możesz zobaczyć i zmienić aktywny model w Ustawienia → AI → Model. Domyślny jest najbardziej sprawny dostępny model. Rzadko jest powód do zmiany, chyba że musisz obniżyć koszty lub obejść konkretne ograniczenie modelu.
OCR Zrzutów Ekranu — Automatyczne Wyodrębnianie Tekstu i Kopiowanie do Schowka
Ekstrakcja AI nie ogranicza się do nagrań audio. Gdy robisz zrzut ekranu z włączoną opcją "Extract text (OCR) and copy to clipboard", SeaMeet automatycznie uruchamia OCR na przechwyconym obrazie i kopiuje wyodrębniony tekst do schowka.
Jak to działa
- Przed przechwyceniem: Zaznacz pole "Extract text (OCR) and copy to clipboard" w Capture Hub lub nakładce Selektora regionu
- Zrób zrzut ekranu (Full Screen lub Area Capture)
- Poczekaj ~15–30 sekund — pipeline AI przetwarza obraz w tle
- Tekst jest kopiowany do schowka — powiadomienie potwierdza "Extracted text copied to clipboard"
- Wklej gdziekolwiek — Cmd+V / Ctrl+V, aby wkleić wyodrębniony tekst
Pipeline OCR działa w pełni w tle. Możesz kontynuować korzystanie z SeaMeet lub przejść do innych aplikacji podczas przetwarzania. Schowek jest aktualizowany automatycznie po zakończeniu ekstrakcji.
Gdzie znaleźć ustawienie
Opcja automatycznego kopiowania OCR pojawia się w trzech miejscach:
| Lokalizacja | Co kontroluje |
|---|---|
| Capture Hub (Panel zrzutu ekranu) | Przełącznik na przechwycenie — pole wyboru pod selektorem trybu przechwytywania |
| Selektor regionu nakładka | Przełącznik na przechwycenie — pole wyboru obok "Capture Screen or Press Enter" |
| Ustawienia → AI Extraction & Summary | Domyślne włączenie/wyłączenie — przełącznik "Auto-extract text (OCR) on screenshot" |
Wszystkie trzy lokalizacje są zsynchronizowane. Przełączanie w dowolnej lokalizacji aktualizuje pozostałe.
Wymagania
- Skonfigurowany Klucz API Gemini (lub aktywna subskrypcja z zarządzanym kluczem)
- Funkcje AI włączone w Ustawieniach
Jeśli Klucz API nie jest dostępny, pole wyboru jest wyszarzone i wyświetla "(API key required, subscribe here)" z linkiem do portalu subskrypcji.
Co jest wyodrębniane
Pipeline OCR wyodrębnia cały widoczny tekst ze zrzutu ekranu — w tym:
- Etykiety interfejsu, menu i przyciski
- Treść dokumentów i stron internetowych
- Komunikaty o błędach i tekst okien dialogowych
- Kod i wyjście terminala
- Tekst pisany odręcznie (jeśli czytelny)
Wyodrębniony tekst jest również zapisywany w panelu Ekstrakcji AI zrzutu ekranu na karcie Text (OCR), dzięki czemu możesz go przejrzeć lub ponownie skopiować później.
Regeneracja
Jeśli nie jesteś zadowolony z wyników lub chcesz nową analizę po zmianie nazw mówców, możesz zregenerować.
-
Kliknij przycisk ⟳ (regeneruj) w pasku kart
- Co widzisz: Przycisk obraca się. Krótkie powiadomienie "Przetwarzanie…" zastępuje treść.
-
Poczekaj (ten sam czas co przy początkowej generacji)
- Co widzisz: Wszystkie pięć kart odświeża się nowymi wynikami.
-
Przejrzyj nowe wyniki
Ważne: Przed nadpisaniem wyników SeaMeet automatycznie archiwizuje poprzednią ekstrakcję jako snapshot wersji. Nic nie jest nigdy tracone. Możesz przeglądać poprzednie wersje w dowolnym momencie — patrz Rozdział 29, Część B.
Eksport
Pasek kart zawiera przyciski eksportu umożliwiające przeniesienie wyników poza SeaMeet:
[Transkrypcja] [Podsumowanie] [Działania] [Decyzje] [Rozdziały] · [MD] [SRT] [JSON] [⟳]
| Przycisk | Format | Najlepszy do |
|---|---|---|
| MD | Markdown | Aplikacje do notatek (Notion, Obsidian), dokumentacja |
| SRT | Napisy SubRip | Dodawanie napisów do plików wideo (iMovie, Premiere, YouTube) |
| JSON | Dane JSON | Deweloperzy, importowanie do innych narzędzi |
Aktywna karta określa, co jest eksportowane:
- Na karcie Podsumowanie → MD eksportuje tekst podsumowania
- Na karcie Transkrypcja → SRT eksportuje transkrypcję ze znacznikami czasu jako napisy
- Na karcie Działania → MD lub JSON eksportuje listę elementów działań
Wskazówka: Eksportuj przed regeneracją, jeśli chcesz autonomiczną kopię bieżących wyników — choć nie jest to ściśle konieczne, ponieważ historia wersji automatycznie zachowuje poprzednie wyniki (patrz Rozdział 29).
Rozwiązywanie Problemów
"Ekstrakcja nie powiodła się"
Objaw: Spinner zatrzymuje się i pojawia się komunikat o błędzie: "Extraction failed" lub "Something went wrong."
Spróbuj po kolei:
- Sprawdź połączenie internetowe — spróbuj załadować stronę internetową
- Sprawdź, czy Twój Klucz API jest nadal prawidłowy (Ustawienia → AI → poszukaj zielonego ptaszka)
- Poczekaj 2–3 minuty i spróbuj ponownie — usługa AI może być tymczasowo przeciążona
- Jeśli nagranie jest bardzo długie (2+ godziny), spróbuj je podzielić lub daj więcej czasu na przetwarzanie
"Podsumowanie wydaje się niekompletne"
Objaw: Podsumowanie jest krótkie, pomija kluczowe tematy lub wydaje się generyczne.
Możliwe przyczyny:
- Jakość audio była słaba — błędy transkrypcji prowadzą do błędów ekstrakcji. Sprawdź kartę Transkrypcja pod kątem niezrozumiałych segmentów.
- Nagranie uchwyciło zbyt mało głosu — jeśli audio systemu dominowało (muzyka, odtwarzanie wideo), AI mogła mieć mało mowy do przetworzenia
- Bardzo krótkie nagranie — nagrania poniżej 2 minut produkują ograniczone podsumowania
Co spróbować:
- Uruchom ponownie ekstrakcję za pomocą ⟳ po zmianie nazw mówców i przejrzeniu transkrypcji
- Popraw umiejscowienie Mikrofonu przy przyszłych nagraniach
"Elementy działań są puste"
Objaw: Karta Działania jest pusta nawet po spotkaniu, na którym wyraźnie przypisano zadania.
Co się dzieje: AI wyciąga działania z jawnego języka ("Czy możesz…", "Zajmę się tym…", "Upewnijmy się, że…"). Niejawne lub nieformalne zobowiązania mogą zostać pominięte.
Co spróbować:
- Sprawdź kartę Transkrypcja — jeśli rozmowa była nieformalna, AI mogła nie zidentyfikować wyraźnego języka działań
- To oczekiwane zachowanie dla swobodnych, eksploracyjnych rozmów, a nie ustrukturyzowanych spotkań
Najlepsze Praktyki
Wyższa jakość audio → lepsze wyniki Każdy etap ekstrakcji zależy od dokładności transkrypcji. Nagranie wykonane wysokiej jakości Mikrofonem w cichym pokoju da dramatycznie lepsze wyniki niż nagranie z hałasem w tle i echem. Zainwestuj w dobry Mikrofon w zestawie słuchawkowym do regularnych nagrań spotkań.
Nagrywaj zarówno Mikrofon, jak i audio systemu Jeśli nagrywasz wirtualne spotkanie (Zoom, Teams, Google Meet), użyj trybu audio "Oba", aby audio systemu (inni uczestnicy) było rejestrowane razem z Twoim Mikrofonem. Ekstrakcja z jednostronnej rozmowy daje jednostronne wyniki.
Zmień nazwy mówców przed regeneracją Nazwy mówców pojawiają się w kartach Podsumowanie i Działania. Zmiana "Mówca 1" na "Alice" przed kliknięciem ⟳ daje znacznie bardziej czytelne podsumowanie. Patrz Rozdział 29, jak zmieniać nazwy mówców.
Dłuższe nagrania dają bogatsze podsumowania Pięciominutowe spotkanie da krótkie podsumowanie. 45-minutowa dyskusja strategiczna da szczegółowe, ustrukturyzowane podsumowanie z wyraźnymi sekcjami. Ekstrakcja AI jest najbardziej wartościowa dla merytorycznych nagrań.
Używaj Rozdziałów do nawigacji W przypadku nagrań powyżej 20 minut zawsze najpierw sprawdzaj kartę Rozdziały. Daje Ci mapę dyskusji, znacznie przyspieszając przejście do interesującej Cię sekcji.
Szybka Dokumentacja
┌────────────────────────────────────────────────────────────┐
│ EKSTRAKCJA AI │
│ Szybka Dokumentacja │
├────────────────────────────────────────────────────────────┤
│ Uruchom │ Karta AI Insights → ✨ Generate Summary │
│ Regeneruj │ Przycisk ⟳ w pasku kart │
│ Poprzednie wyniki │ Bezpiecznie zarchiwizowane — patrz Rozdz. 29 │
├────────────────────────────────────────────────────────────┤
│ Transkrypcja │ Pełny tekst + znaczniki czasu, kliknij aby przejść │
│ Podsumowanie │ Narracyjny przegląd dyskusji │
│ Działania │ Zadania + przypisania + terminy │
│ Decyzje │ Uzgodnienia i podjęte wybory │
│ Rozdziały │ Mapa tematyczna z indeksem czasu, kliknij aby przejść │
├────────────────────────────────────────────────────────────┤
│ Eksport: MD │ Markdown — do aplikacji z notatkami │
│ Eksport: SRT │ Napisy — do edytorów wideo │
│ Eksport: JSON │ Dane strukturalne — dla deweloperów │
├────────────────────────────────────────────────────────────┤
│ Screenshot OCR │ Auto-wyodrębnianie tekstu + kopia do │
│ │ schowka │
│ Ustawienie OCR │ Pole wyboru Capture Hub lub │
│ │ Ustawienia → AI │
├────────────────────────────────────────────────────────────┤
│ Wymaga │ Internet + Funkcje AI włączone + Klucz API │
│ Działa na │ Dowolnym nagraniu lub zrzucie ekranu │
└────────────────────────────────────────────────────────────┘
Ostatnia aktualizacja: 2026-03-27
← Rozdział 27: Transkrypcja na Żywo | Rozdział 29: Edytowanie Wyników AI →
Published: