فصل ۲۷: رونویسی زنده — کلمات روی صفحه در حین صحبت

یک منشی دادگاه را تصور کنید که در حین جلسه تایپ می‌کند—هر کلمه‌ای در لحظه‌ای که گفته می‌شود ضبط می‌شود، بدون نیاز به انتظار تا پایان جلسه. این دقیقاً همان کاری است که رونویسی زنده SeaMeet برای ضبط‌های شما انجام می‌دهد. در حالی که صحبت می‌کنید، پنل رونویسی در زمان واقعی پر می‌شود: برچسب‌های گوینده، زمان‌بندی‌ها، و کلمات واقعی، همه آن‌ها در حین مکالمه ظاهر می‌شوند.

بدون انتظار. بدون مرحله آپلود. فقط کلمات روی صفحه.

اهداف فصل

پس از خواندن این فصل، خواهید توانست:

بفهمید رونویسی زنده چه کاری انجام می‌دهد و چه زمانی از آن استفاده کنید
پیش‌نیازها را قبل از شروع تنظیم کنید
یک جلسه ضبط با رونویسی زنده فعال شروع کنید
پنل رونویسی را در حین ضبط بخوانید و تفسیر کنید
بفهمید تشخیص خودکار گوینده چطور کار می‌کند
رایج‌ترین مشکلات اتصال و نمایش را عیب‌یابی کنید

رونویسی زنده چیست؟

رونویسی زنده صدای ضبط شما را در حین ضبط به متن تبدیل می‌کند و یک رونویسی دارای زمان‌بندی و برچسب گوینده در زمان واقعی تولید می‌کند.

اینگونه فکر کنید: یک تایپیست را تصور کنید که کنار شما در هر جلسه نشسته و فوری همه چیزی که گفته می‌شود را می‌نویسد—کلمات هر نفر را برچسب می‌زند و زمان دقیق صحبت را یادداشت می‌کند. آن رونویسی در لحظه پایان جلسه در دسترس است. بدون تأخیر رونویسی. بدون چرخش «صدایتان را پردازش می‌کنیم».

رونویسی زنده در کنار جلسه ضبط شما اجرا می‌شود. در لحظه‌ای که ضبط را شروع می‌کنید:

یک موتور هوش مصنوعی شروع به گوش دادن می‌کند
کلمات چند ثانیه پس از گفته شدن در پنل رونویسی ظاهر می‌شوند
برچسب‌های گوینده («Speaker 1»، «Speaker 2») به صورت خودکار اختصاص می‌یابند
زمان‌بندی‌ها نشان می‌دهند هر بخش در کجای ضبط قرار دارد

وقتی ضبط را متوقف می‌کنید، رونویسی کامل به صورت خودکار کنار فایل صدا/تصویر ذخیره می‌شود.

قبل از شروع

رونویسی زنده قبل از اولین جلسه نیاز به پیکربندی دو چیز دارد:

۱. ویژگی‌های هوش مصنوعی فعال شده

تنظیمات را باز کنید (آیکون چرخ‌دنده ⚙️ در گوشه بالا راست)
به دسته AI بروید
تأیید کنید که کلید ویژگی‌های هوش مصنوعی روشن (آبی) است

اگر کلید خاکستری است یا دسته AI وجود ندارد، با مدیر حساب خود تماس بگیرید—ویژگی‌های هوش مصنوعی ممکن است به یک اشتراک فعال نیاز داشته باشند.

۲. کلید API پیکربندی شده

هنوز در تنظیمات → AI:

به دنبال فیلد کلید API بگردید
کلید API Gemini خود را وارد کنید (برای نحوه دریافت آن به فصل ۳۱ مراجعه کنید)
روی ذخیره کلیک کنید

یک علامت تیک سبز تأیید می‌کند کلید معتبر است. یک هشدار قرمز نشان می‌دهد کلید نادرست است یا منقضی شده.

توجه: در طول ضبط به یک اتصال اینترنت فعال نیاز دارید. رونویسی زنده نمی‌تواند آفلاین اجرا شود.

چگونه یک جلسه رونویسی زنده شروع کنید

شروع رونویسی زنده با شروع هر ضبطی یکسان است—هیچ «حالت رونویسی» جداگانه‌ای برای فعال کردن وجود ندارد. اگر ویژگی‌های هوش مصنوعی روشن است و یک کلید API پیکربندی شده، رونویسی زنده به صورت خودکار فعال می‌شود.

گام‌به‌گام:

دکمه ضبط قرمز را کلیک کنید 🔴 (یا از میانبر صفحه‌کلید استفاده کنید: Ctrl+Alt+A در ویندوز، Cmd+Shift+A در macOS)
- چه می‌بینید: دکمه قرمز ضربان می‌زند. تایمر ضبط شروع به شمارش می‌کند.
پنل رونویسی را تماشا کنید که ظاهر می‌شود
- چه می‌بینید: یک پنل به سمت راست پنجره اصلی می‌لغزد (یا زیر پخش‌کننده، بسته به چیدمان شما). به طور مختصر «در حال اتصال...» نشان می‌دهد.
به صورت معمولی صحبت کنید
- چه می‌بینید: بعد از ۲ تا ۵ ثانیه، متن شروع به ظاهر شدن می‌کند. آخرین عبارت یک انیمیشن ظریف نشان می‌دهد که هنوز در حال پردازش است.
جلسه یا ضبط خود را به صورت معمول ادامه دهید
- چه می‌بینید: بخش‌های کامل‌شده به ترتیب زمانی انباشته می‌شوند، هر کدام با یک برچسب گوینده و زمان‌بندی علامت‌گذاری شده.
وقتی تمام شد ضبط را متوقف کنید
- چه می‌بینید: دکمه به حالت بی‌کاری برمی‌گردد. یک اعلان «در حال ذخیره رونویسی...» به طور مختصر چشمک می‌زند، سپس ناپدید می‌شود. رونویسی ذخیره می‌شود.

چه می‌بینید در حین ضبط

پنل رونویسی سه ناحیه اصلی دارد:

┌─────────────────────────────────────────────┐
│  Transcript                    🟢 Connected  │
├─────────────────────────────────────────────┤
│  Speaker 1   0:00:12                        │
│  "Good morning everyone, let's get started" │
│                                             │
│  Speaker 2   0:00:24                        │
│  "Thanks for joining on short notice"       │
│                                             │
│  Speaker 1   0:00:31                        │
│  "Of course. First item on the agenda…"    │
├─────────────────────────────────────────────┤
│  Now Speaking…  ████████░░░░                │
│  "…is the Q3 budget review"                 │
└─────────────────────────────────────────────┘

معنی هر عنصر:

عنصر	معنی
برچسب گوینده	چه کسی صحبت می‌کند — به صورت خودکار اختصاص می‌یابد («Speaker 1»، «Speaker 2»)
زمان‌بندی	این بخش در کجای ضبط شروع می‌شود (ساعت:دقیقه:ثانیه)
متن کامل‌شده	کلمات نهایی‌شده — اینها تغییر نمی‌کنند
پیش‌نمایش «Now Speaking…»	گفتار فعلی که هنوز در حال پردازش است — ممکن است کمی تغییر کند
نشانگر وضعیت	🟢 Connected · 🟡 Connecting · 🔴 Error

نشانگر وضعیت اتصال

نشانگر در گوشه بالا راست پنل به شما می‌گوید آیا موتور هوش مصنوعی قابل دسترسی است:

🟢 Connected — رونویسی به صورت عادی در حال اجرا است
🟡 Connecting — در حال برقراری اتصال (در ابتدای راه‌اندازی طبیعی است، ۲ تا ۵ ثانیه طول می‌کشد)
🔴 Error — اتصال قطع شده (به عیب‌یابی زیر مراجعه کنید)

اگر 🔴 Error می‌بینید، ضبط خودش به صورت ایمن ادامه می‌دهد—فقط رونویسی زنده تحت تأثیر است.

تشخیص خودکار گوینده

موتور هوش مصنوعی سعی می‌کند بین صداهای مختلف تمایز قائل شود و به هر کدام یک برچسب اختصاص دهد.

چطور کار می‌کند:

جدول زمانی ضبط:

0:00 ──────────────────────────────────────────────────► زمان
        │           │           │           │
      Speaker 1   Speaker 2   Speaker 1   Speaker 2
      "Morning"   "Hello"     "Agenda…"   "Agreed"
          ▼           ▼           ▼           ▼
      [بخش ۱]    [بخش ۲]    [بخش ۳]    [بخش ۴]

هر بار که گوینده تغییر می‌کند، سیستم یک بخش جدید ایجاد می‌کند. بخش‌های یک گوینده یکسان برچسب یکسانی دریافت می‌کنند.

برچسب‌های اولیه: اولین گوینده «Speaker 1» است، دومین صدای جدید «Speaker 2» است و همینطور ادامه می‌یابد. اینها مکان‌نگه‌دار هستند—می‌توانید آن‌ها را بعداً تغییر نام دهید (فصل ۲۹ را ببینید).

اصلاح گوینده: با پیشرفت ضبط، هوش مصنوعی ممکن است تخصیص‌های قبلی را اصلاح کند اگر مطمئن شود که دو بخش متعلق به یک صدا هستند. این طبیعی است. متن تغییر نمی‌کند—فقط انتساب گوینده در بخش‌های قبلی.

نکته: برای دقیق‌ترین تفکیک گوینده، به جای بلندگو از هدفون استفاده کنید. خروجی بلندگو که توسط میکروفون شما گرفته می‌شود می‌تواند آشکارساز را گیج کند.

بعد از توقف ضبط

وقتی توقف را کلیک می‌کنید:

پیش‌نمایش «Now Speaking…» هر جمله در حال پیشرفت را نهایی می‌کند
رونویسی کامل به صورت خودکار کنار فایل ضبط ذخیره می‌شود
هیچ اقدام دستی لازم نیست

کجا رونویسی را پیدا کنید:

ضبط را در کتابخانه ضبط باز کنید
روی AI Insights در پنل جزئیات کلیک کنید
تب Transcript را انتخاب کنید

رونویسی همچنین برای صادرکردن به عنوان SRT (فرمت زیرنویس) یا JSON از تب AI Insights در دسترس است. برای جزئیات صادرکردن فصل ۲۸ را ببینید.

محدودیت‌ها

درک این محدودیت‌ها به تنظیم انتظارات واقع‌بینانه کمک می‌کند:

محدودیت	جزئیات
نیاز به اینترنت	رونویسی زنده نمی‌تواند آفلاین اجرا شود. صدا توسط یک موتور هوش مصنوعی از طریق شبکه پردازش می‌شود.
دقت زمان‌بندی	زمان‌بندی‌ها تقریبی هستند (±۳ ثانیه). از آن‌ها برای ناوبری استفاده کنید، نه برای مستندات حقوقی.
مکث در ضبط	اگر ضبط را مکث کنید، رونویسی هم مکث می‌کند. بخش‌های مکث‌شده رونویسی نمی‌شوند.
دقت متفاوت است	دقت با گفتار واضح، یک گوینده در یک زمان، و میکروفون خوب بالاترین است. لهجه‌های سنگین، سر و صدای پس‌زمینه، یا صحبت متقاطع دقت را کاهش می‌دهند.
زبان	زبان رونویسی می‌تواند روی Auto Detect (پیشنهادی) یا یک زبان خاص در تنظیمات → AI → SeaMeet Integration تنظیم شود. Auto Detect جلسات چندزبانی را به صورت خودکار مدیریت می‌کند.
بدون ویرایش در زمان واقعی	نمی‌توانید در حین ضبط رونویسی را ویرایش کنید. ویرایش بعد از توقف ضبط در دسترس است.

پوشش زیرنویس در حین پخش

وقتی ضبطی را پخش می‌کنید که دارای رونویسی زنده است، SeaMeet می‌تواند زیرنویس را مستقیماً روی ویدیو نمایش دهد—مثل زیرنویس بسته در تلویزیون.

چطور زیرنویس کار می‌کند:

متن زیرنویس روی پیش‌نمایش ویدیو در پایین قاب نمایش داده می‌شود
هر بخش نام گوینده (رنگ‌بندی‌شده بر اساس گوینده) و متن گفته‌شده را نشان می‌دهد
زیرنویس با موقعیت پخش همگام است—با پیشرفت ضبط جلو می‌رود
زیرنویس به صورت خودکار از رونویسی Gemini Live جلسه استفاده می‌کند

رنگ‌های گوینده: به هر گوینده یک رنگ ثابت در تمام زیرنویس‌ها و پنل‌های رونویسی اختصاص می‌یابد. رنگ‌ها به صورت خودکار تعیین می‌شوند و در طول ضبط ثابت می‌مانند.

فرمت زیرنویس:

[Speaker 1]: Good morning everyone, let's get started.

زیرنویس‌ها ظاهر می‌شوند و ناپدید می‌شوند زمانی که بخش رونویسی متناظر پخش می‌شود.

چیدمان ویدیوی دو ستونی

هنگام تماشای یک ضبط ویدیویی با رونویسی زنده موجود، SeaMeet از یک چیدمان دو ستونی استفاده می‌کند:

┌─────────────────────────────────────────────────────┐
│  پیش‌نمایش ویدیو             │  پنل رونویسی         │
│                              │                      │
│  [ویدیو با زیرنویس]          │  Speaker 1   0:00:12 │
│                              │  "Good morning..."   │
│                              │                      │
│                              │  Speaker 2   0:00:24 │
│                              │  "Thanks for joining"│
│                              │              [⤢ Max] │
└─────────────────────────────────────────────────────┘

ستون چپ: ویدیوی با عرض ثابت با پوشش زیرنویس
ستون راست: پنل رونویسی پیمایشی، همگام با موقعیت پخش
دکمه بزرگنمایی (⤢): پنل رونویسی را به پوشش تمام‌صفحه گسترش می‌دهد برای خواندن آسان‌تر در حین ضبط‌های طولانی

چیدمان دو ستونی فقط برای ضبط‌های ویدیویی با رونویسی زنده ظاهر می‌شود. ضبط‌های فقط صدا و ضبط‌های بدون رونویسی از چیدمان تک ستونی استاندارد استفاده می‌کنند.

تنظیمات زبان برای رونویسی

می‌توانید پیکربندی کنید SeaMeet در حین رونویسی زنده چه زبانی را انتظار دارد:

تنظیمات را باز کنید (⚙️)
به AI → SeaMeet Integration بروید
انتخاب‌کننده Meeting Language را پیدا کنید
زبان خود را انتخاب کنید:
- Auto Detect (پیش‌فرض، پیشنهادی) — SeaMeet زبان گفته‌شده را به صورت خودکار شناسایی می‌کند. برای جلسات چندزبانی یا وقتی زبان متفاوت است بهترین است.
- انتخاب دستی — از ۲۰+ زبان خاص از جمله انگلیسی (آمریکایی/بریتانیایی)، اسپانیایی، فرانسوی، آلمانی، ژاپنی، ماندارین، کانتونی، کره‌ای، و بیشتر انتخاب کنید.

نکته: زبان را روی Auto Detect نگه دارید مگر اینکه دلیل خاصی برای اجبار یک زبان داشته باشید. تشخیص خودکار با لهجه‌ها و جلسات چندزبانی بهتر از یک تنظیم دستی اجباری کنار می‌آید.

عیب‌یابی

«پنل رونویسی ظاهر نمی‌شود»

علامت: ضبط را شروع می‌کنید اما پنل رونویسی هرگز نشان داده نمی‌شود.

به ترتیب اینها را بررسی کنید:

به تنظیمات → AI بروید و تأیید کنید کلید ویژگی‌های هوش مصنوعی روشن است
تأیید کنید کلید API شما معتبر است (علامت تیک سبز در تنظیمات → AI)
اتصال اینترنت خود را بررسی کنید—سعی کنید یک صفحه وب بارگذاری کنید
SeaMeet را مجدداً راه‌اندازی کنید و دوباره امتحان کنید

اگر پنل بعد از هر چهار مرحله هنوز ظاهر نشد، سرویس هوش مصنوعی ممکن است موقتاً در دسترس نباشد. خود ضبط تحت تأثیر نیست—بعداً دوباره امتحان کنید.

«اتصال در حین ضبط قطع شد»

علامت: نشانگر وضعیت در حین یک ضبط به 🔴 قرمز تبدیل می‌شود.

چه اتفاقی افتاد: اتصال به موتور هوش مصنوعی قطع شد. این می‌تواند به دلیل:

قطعی موقت شبکه
Wi-Fi در حال تغییر نقاط دسترسی
سرویس هوش مصنوعی که به طور مختصر آفلاین شده

چه کاری انجام دهید:

ضبط را متوقف نکنید—به صورت ایمن ادامه می‌دهد
اتصال اینترنت خود را بررسی کنید
اتصال معمولاً در عرض ۳۰ ثانیه به صورت خودکار بازیابی می‌شود
کلمات گفته‌شده در دوره قطعی بازیابی نمی‌شوند—برای رونویسی زنده از دست رفته‌اند (اما صدا در فایل ضبط باقی می‌ماند، بنابراین می‌توانید بعد از آن AI Extraction را اجرا کنید—فصل ۲۸ را ببینید)

«گویندگان به درستی برچسب‌گذاری نمی‌شوند»

علامت: چندین نفر به عنوان «Speaker 1» برچسب خورده‌اند، یا یک نفر به عنوان دو گوینده مختلف ظاهر می‌شود.

چه اتفاقی می‌افتد: تشخیص گوینده از ویژگی‌های صدا استفاده می‌کند. دقت کاهش می‌یابد وقتی:

چندین نفر به طور همزمان صحبت می‌کنند
صدای گوینده به طور قابل توجهی تغییر می‌کند (خنده، صدای بلند، صدای ضعیف)
سر و صدای پس‌زمینه اختلال ایجاد می‌کند

چه کاری انجام دهید:

بعد از ضبط، گویندگان را در پنل گویندگان تغییر نام دهید (فصل ۲۹ را ببینید)
از ویژگی Merge برای ترکیب دو برچسبی که به یک نفر تعلق دارند استفاده کنید (فصل ۲۹)

بهترین روش‌ها

برای بهترین نتایج رونویسی زنده این روش‌ها را دنبال کنید:

یک گوینده در یک زمان صحبت متقاطع (دو نفر که به طور همزمان صحبت می‌کنند) تشخیص گوینده را گیج کرده و متن نامفهوم در رونویسی تولید می‌کند. شرکت‌کنندگان را تشویق کنید نوبتی صحبت کنند.

محیط ضبط آرام سر و صدای پس‌زمینه—سیستم‌های تهویه، تایپ، سر و صدای خیابان—توسط میکروفون گرفته شده و دقت رونویسی را کاهش می‌دهد. یک میکروفون هدست که نزدیک دهان قرار دارد نتایج بسیار بهتری نسبت به میکروفون داخلی لپ‌تاپ می‌دهد.

موقعیت‌دهی خوب میکروفون برای جلسات حضوری با چندین شرکت‌کننده، میکروفون را نزدیک مرکز میز قرار دهید، یا برای هر شرکت‌کننده از میکروفون‌های جداگانه استفاده کنید.

اتصال اینترنت پایدار از یک اتصال سیمی یا یک سیگنال Wi-Fi قوی استفاده کنید. از hotspot‌ها یا شبکه‌هایی با از دست دادن بسته بالا اجتناب کنید—آن‌ها باعث قطع اتصال می‌شوند.

فوری گویندگان را تغییر نام دهید تغییر نام گوینده را بلافاصله بعد از ضبط انجام دهید در حالی که به خاطر دارید چه کسی چه گفت. دستورالعمل‌ها را در فصل ۲۹ ببینید.

مرجع سریع

┌────────────────────────────────────────────────────────────┐
│                  رونویسی زنده                               │
│                   مرجع سریع                                 │
├────────────────────────────────────────────────────────────┤
│  شروع             │ به صورت عادی ضبط کنید — فعال خودکار   │
│  وضعیت: سبز       │ 🟢 رونویسی در حال اجرا                │
│  وضعیت: زرد       │ 🟡 در حال اتصال (۵ ثانیه صبر کنید)    │
│  وضعیت: قرمز      │ 🔴 قطع شده — ضبط ایمن                 │
├────────────────────────────────────────────────────────────┤
│  پنل رونویسی      │ سمت راست پنجره اصلی                   │
│  خط پیش‌نمایش    │ «Now Speaking…» — در حال پیشرفت        │
│  خطوط کامل‌شده   │ نهایی — تغییر نمی‌کنند                 │
├────────────────────────────────────────────────────────────┤
│  بعد از توقف      │ رونویسی به صورت خودکار ذخیره می‌شود    │
│  پیدا کنید       │ ضبط → AI Insights → Transcript         │
├────────────────────────────────────────────────────────────┤
│  نیاز دارد        │ اینترنت + ویژگی‌های AI روشن + کلید API │
│  زمان‌بندی        │ تقریبی ±۳ ثانیه                       │
│  مکث‌ها           │ رونویسی نمی‌شوند                       │
└────────────────────────────────────────────────────────────┘

آخرین به‌روزرسانی: 2026-03-20

← فصل ۲۶: واژه‌نامه اصطلاحات | فصل ۲۸: AI Extraction →

رونویسی زنده - کلمات روی صفحه در حین صحبت