நேரடி ஒலிப்பெயர்ப்பு - நீங்கள் பேசும்போது திரையில் வார்த்தைகள்
அத்தியாயம் 27: நேரடி ஒலிப்பெயர்ப்பு — நீங்கள் பேசும்போது திரையில் வார்த்தைகள்
நீதிமன்ற நிகழ்வு விரிவடையும்போது தட்டச்சு செய்யும் ஒரு நீதிமன்ற அறிவிப்பாளரை நினைத்துக்கொள்ளுங்கள்—ஒவ்வொரு வார்த்தையும் சொல்லப்பட்ட தருணத்திலேயே பதிவாகிறது, கூட்டம் முடியும் வரை காக்க வேண்டாம். அதைத்தான் SeaMeet-ன் நேரடி ஒலிப்பெயர்ப்பு உங்கள் பதிவுகளுக்கு செய்கிறது. நீங்கள் பேசும்போது, ஒலிப்பெயர்ப்பு பலகம் நிகழ்நேரத்தில் நிரம்புகிறது: பேச்சாளர் பெயர்ப்பாளிகள், நேர முத்திரைகள் மற்றும் உண்மையான வார்த்தைகள், உரையாடல் நடக்கும்போதே தோன்றுகின்றன.
காத்திருக்க வேண்டாம். பதிவேற்றம் படி இல்லை. திரையில் வார்த்தைகள் மட்டுமே.
அத்தியாய நோக்கங்கள்
இந்த அத்தியாயத்தை படித்த பிறகு, நீங்கள் இதை செய்ய முடியும்:
- நேரடி ஒலிப்பெயர்ப்பு என்ன செய்கிறது மற்றும் எப்போது பயன்படுத்தவும் என்று புரிந்துகொள்ளுங்கள்
- தொடங்குவதற்கு முன் தேவைகளை அமைக்கவும்
- நேரடி ஒலிப்பெயர்ப்பு செயலில் ஒரு பதிவு அமர்வை தொடங்கவும்
- பதிவு செய்யும்போது ஒலிப்பெயர்ப்பு பலகத்தை படித்து விளக்கவும்
- தானியங்கி பேச்சாளர் கண்டறிதல் எப்படி செயல்படுகிறது என்று புரிந்துகொள்ளுங்கள்
- மிகவும் பொதுவான இணைப்பு மற்றும் காட்சி சிக்கல்களை தீர்க்கவும்
நேரடி ஒலிப்பெயர்ப்பு என்றால் என்ன?
நேரடி ஒலிப்பெயர்ப்பு உங்கள் பதிவிலிருந்து ஒலியை நீங்கள் பதிவு செய்யும்போதே உரையாக மாற்றுகிறது, நிகழ்நேரத்தில் நேர முத்திரையிட்ட, பேச்சாளர்-பெயர்ப்பாளர்-கொண்ட ஒலிப்பெயர்ப்பை உருவாக்குகிறது.
இப்படி நினைத்துக்கொள்ளுங்கள்: ஒவ்வொரு கூட்டத்திலும் உங்களுக்கு அடுத்தே ஒரு தட்டச்சு நிபுணர் இருந்து, சொல்லப்பட்ட எல்லாவற்றையும் உடனடியாக எழுதுகிறார்—ஒவ்வொரு நபரின் வார்த்தைகளுக்கும் பெயர்ப்பாளி வைத்து, சரியான நேரம் குறித்து. கூட்டம் முடிந்தவுடன ் அந்த ஒலிப்பெயர்ப்பு தயாராக இருக்கும். ஒலிப்பெயர்ப்பு தாமதம் இல்லை. "உங்கள் ஒலியை செயலாக்குகிறோம்" சுழலி இல்லை.
நேரடி ஒலிப்பெயர்ப்பு உங்கள் பதிவு அமர்வுடன் ஒரே நேரத்தில் இயங்குகிறது. நீங்கள் பதிவை தொடங்கிய தருணம்:
- ஒரு AI எஞ்சின் கேட்கத் தொடங்குகிறது
- பேசப்பட்டு சில நொடிகளில் ஒலிப்பெயர்ப்பு பலகத்தில் வார்த்தைகள் தோன்றுகின்றன
- பேச்சாளர் பெயர்ப்பாளிகள் ("பேச்சாளர் 1", "பேச்சாளர் 2") தானாகவே ஒதுக்கப்படுகின்றன
- நேர முத்திரைகள் ஒவ்வொரு பகுதியும் பதிவில் எங்கே வருகிறது என்று குறிக்கின்றன
பதிவை நிறுத்தும்போது, முழுமையான ஒலிப்பெயர்ப்பு ஒலி/வீடியோ கோப்புடன் தானாகவே சேமிக்கப்படுகிறது.
தொடங்குவதற்கு முன்
நேரடி ஒலிப்பெயர்ப்பிற்கு உங்கள் முதல் அமர்வுக்கு முன் இரண்டு விஷயங்கள் கட்டமைக்கப்பட வேண்டும்:
1. AI அம்சங்கள் இயக்கப்பட்டுள்ளன
- அமைப்புகள் திறக்கவும் (மேல்-வலது மூலையில் கியர் ஐகான் ⚙️)
- AI வகைக்கு செல்லவும்
- AI அம்சங்கள் நிலை மாற்ற ி இயக்கப்பட்டிருப்பதை (நீலம்) உறுதிப்படுத்துங்கள்
நிலை மாற்றி சாம்பல் நிறமாக இருந்தால் அல்லது AI வகை இல்லாமல் இருந்தால், உங்கள் கணக்கு நிர்வாகியை தொடர்பு கொள்ளுங்கள்—AI அம்சங்களுக்கு செயலில் உள்ள சந்தா தேவைப்படலாம்.
2. API விசை கட்டமைக்கப்பட்டுள்ளது
இன்னும் அமைப்புகள் → AI-ல்:
- API விசை புலத்தை தேடுங்கள்
- உங்கள் Gemini API விசையை உள்ளிடவும் (அதை எப்படி பெறுவது என்று அத்தியாயம் 31 பாருங்கள்)
- சேமி கிளிக் செ ய்யவும்
பச்சை சரிபார்ப்பு குறி விசை சரியானது என்று உறுதிப்படுத்துகிறது. சிவப்பு எச்சரிக்கை என்றால் விசை தவறானது அல்லது காலாவதியானது.
குறிப்பு: பதிவு செய்யும்போது செயலில் உள்ள இணைய இணைப்பு தேவை. நேரடி ஒலிப்பெயர்ப்பு ஆஃப்லைனில் இயங்காது.
நேரடி ஒலிப்பெயர்ப்பு அமர்வை தொடங்குவது எப்படி
நேரடி ஒலிப்பெயர்ப்பை தொடங்குவது எந்த பதிவையும் தொடங்குவதற்கு இணையானது—இயக்க தனியான "ஒலிப்பெயர்ப்பு முறை" இல்லை. AI அம்சங்கள் இயக்கியிருந்தால் மற்றும் API விசை கட்டமைக்கப்பட்டிருந்தால், நேரடி ஒலிப்பெயர்ப்பு தானாகவே இயக்கமாகும்.
படிப்படியாக:
-
சிவப்பு பதிவு பொத்தானை கிளிக் செய்யவும் 🔴 (அல்லது விசைப்பலகை குறுக்குவழி பயன்படுத்துங்கள்: Windows-ல்
Ctrl+Alt+A, macOS-ல்Cmd+Shift+A)- நீங்கள் பார்ப்பது: பொத்தான் சிவப்பாக துடிக்கிறது. பதிவு நேரமானி எண்ணத் தொடங்குகிறது.
-
ஒலிப்பெயர்ப்பு பலகம் தோன்றுவதை பாருங்கள்
- நீங்கள் பார்ப்பது: ஒரு பலகம் முக்கிய சாளரத்தின் வலது பக்கம் நழுவி வருகிறது (அல்லது உங்கள் அமைப்பைப் பொறுத்து பிளேயருக்கு கீழே). "இணை க்கிறது…" சிறிது காட்டுகிறது.
-
சாதாரணமாக பேசுங்கள்
- நீங்கள் பார்ப்பது: 2–5 நொடிகளுக்கு பிறகு, உரை தோன்றத் தொடங்குகிறது. இன்னும் செயலாக்கப்படும் சமீபத்திய சொற்றொடர் ஒரு மென்மையான அசைவை காட்டுகிறது.
-
கூட்டம் அல்லது பதிவை வழக்கம்போல் தொடரவும்
- நீங்கள் பார்ப்பது: முடிந்த பகுதிகள் காலவரிசையில் அடுக்கப்படுகின்றன, ஒவ்வொன்றும் பேச்சாளர் பெயர்ப்பாளி மற்றும் நேர முத்திரையுடன்.
-
முடிந்தவுடன் பதிவை நிறுத்துங்கள்
- நீங்கள் பார்ப்பது: பொத்தான் சும்மா நிலைக்கு திரும்புகிறது. "ஒலிப்பெயர்ப்பை சேமிக்கிறது…" அறி விப்பு சிறிது காட்டி மறைகிறது. ஒலிப்பெயர்ப்பு சேமிக்கப்படுகிறது.
பதிவு செய்யும்போது நீங்கள் பார்ப்பது
ஒலிப்பெயர்ப்பு பலகத்தில் மூன்று முக்கிய பகுதிகள் உள்ளன:
┌─────────────────────────────────────────────┐
│ ஒலிப்பெயர்ப்பு 🟢 இணைக்கப்பட்டது │
├─────────────────────────────────────────────┤
│ பேச்சாளர் 1 0:00:12 │
│ "குட் மார்னிங் எவ்ரிவன், ஆரம்பிக்கலாம்" │
│ │
│ பேச்சாளர் 2 0:00:24 │
│ "குறுகிய அவகாசத்தில் சேர்ந்தமைக்கு நன்றி"│
│ │
│ பேச்சாளர் 1 0:00:31 │
│ "நிச்சயமாக. நிரல்பட்டியலில் முதல் விஷயம்…"│
├─────────────────────────────────────────────┤
│ இப்போது பேசுகிறார்… ████████░░░░ │
│ "…Q3 பட்ஜெட் மதிப்பாய்வு" │
└─────────────────────────────────────────────┘
ஒவ்வொரு கூறும் என்ன குறிக்கிறது:
| கூறு | பொருள் |
|---|---|
| பேச்சாளர் பெயர்ப்பாளி | யார் பேசுகிறார் — தானாகவே ஒதுக்கப்படுகிறது ("பேச்சாளர் 1", "பேச்சாளர் 2") |
| நேர முத்திரை | பதிவில் இந்த பகுதி எப்போது தொடங்குகிறது (மணி:நிமிடம்:நொடி) |
| முடிந்த உரை | இறுதியாக்கப்பட்ட வார்த்தைகள் — இவை மாறாது |
| "இப்போது பேசுகிறார்…" முன்னோட்டம் | இன்னும் செயலாக்கப்படும் தற்போதைய வாக்கியம் — சற்று மாறலாம் |
| நிலை குறிகாட்டி | 🟢 இணைக்கப்பட்டது · 🟡 இணைக்கிறது · 🔴 பிழை |
இணைப்பு நிலை குறிகாட்டி
பலகத்தின் மேல்-வலது மூலையிலுள்ள குறிகாட்டி AI எஞ்சின் அணுகக்கூடியதா என்று சொல்கிறது:
- 🟢 இணைக்கப்பட்டது — ஒலிப்பெயர்ப்பு சாதாரணமாக இயங்குகிறது
- 🟡 இணைக்கிறது — இணைப்பை நிறுவுகிறது (தொடக்கத்தில் சாதாரணம், 2–5 நொடிகள் ஆகும்)
- 🔴 பிழை — இணைப்பு இழந்தது (கீழே தீர்க்கும் முறையை பாருங்கள்)
🔴 பிழை தெரிந்தால், பதிவு பாதுகாப்பாக தொடர்கிறது—நேரடி ஒலிப்பெயர்ப்பு மட்டுமே பாதிக்கப்படுகிறது.
தானியங்கி பேச்சாளர் கண்டறிதல்
AI எஞ்சின் வெவ்வேறு குரல்களை வேறுபடுத்த முயற்சிக்கிறது மற்றும் ஒவ்வொன்றிற்கும் ஒரு பெயர்ப்பாளி ஒதுக்குகிறது.
எப்படி செயல்படுகிறது:
பதிவு கோடு:
0:00 ──────────────────────────────────────────────────► நேரம்
│ │ │ │
பேச்சாளர் 1 பேச்சாளர் 2 பேச்சாளர் 1 பேச்சாளர் 2
"காலை" "வணக்கம்" "நிரல்…" "சரி"
▼ ▼ ▼ ▼
[பகுதி 1] [பகுதி 2] [பகுதி 3] [பகுதி 4]
பேச்சாளர் மாறும் ஒவ்வொரு முறையும், கணினி ஒரு புதிய பகுதி உருவாக்குகிறது. ஒரே பேச்சாளரிடமிருந்து வரும் பகுதிகள் ஒரே பெயர்ப்பாளி பெறுகின்றன.
ஆரம்ப பெயர்ப்பாளிகள்: பேசும் முதல் பேச்சாளர் "பேச்சாளர் 1", இரண்டாவது புதிய குரல் "பேச்சாளர் 2", மற்றும் பிற. இவை இடைக்காலம்—பின்னர் மறுபெயரிடலாம் (அத்தியாயம் 29 பாருங்கள்).
பேச்சாளர் மேம்பாடு: பதிவு முன்னேறும்போது, இரண்டு பகுதிகள் ஒரே குரலுக்கு சொந்தமானவை என்று நம்பகமாக கண்டறிந்தால் AI முந்தைய ஒதுக்கீடுகளை மேம்படுத்தலாம். இது இயல்பானது. உரை மாறாது—பழைய பகுதிகளில் பேச்சாளர் பெயர்ப்பாளி மட்டும் மாறலாம்.
குறிப்பு: மிகவும் துல்லியமான பேச்சாளர் பிரிதலுக்கு, ஸ்பீக்கர்களுக்கு பதிலாக ஹெட்ஃபோன் பயன்படுத்துங்கள். மைக்ரோபோன் வழியாக பதிவு செய்யப்படும் ஸ்பீக்கர் வெளியீடு கண்டறிதலை குழப்பலாம்.
பதிவு நிறுத்திய பிறகு
நிறுத்தவும் கிளிக் செய்யும்போது:
- "இப்போது பேசுகிறார்…" முன்னோட்டம் நடைபெறும் வாக்கியத்தை இறுதியாக்குகிறது
- முழுமையான ஒலிப்பெயர்ப்பு உங்கள் பதிவு கோப்புடன் தானாகவே சேமிக்கப்படுகிறது
- கைமுறை செயல் தேவையில்லை
ஒலிப்பெயர்ப்பை எங்கே கண்டுபிடிப்பது:
- பதிவு நூலகத்தில் பதிவை திறக்கவும்
- விவர பலகத்தில் AI Insights கிளிக் செய்யவும்
- Transcript தாவலை தேர்ந்தெடுக்கவும்
ஒலிப்பெயர்ப்பு AI Insights தாவலிலிருந்து SRT (வசன வடிவம்) அல்லது JSON ஆக ஏற்றுமதி செய்யவும் கிடைக்கிறது. ஏற்றுமதி விவரங்களுக்கு அத்தியாயம் 28 பாருங்கள்.
வரம்புகள்
இந்த வரம்புகளை புரிந்துகொள்வது யதார்த்தமான எதிர்பார்ப்புகளை அமைக்க உதவுகிறது:
| வரம்பு | விவரம் |
|---|---|
| இணையம் தேவை | நேரடி ஒலிப்பெயர்ப்பு ஆஃப்லைனில் இயங்காது. ஒலி நெட்வொர்க் மூலம் AI எஞ்சினால் செயலாக்கப்படுகிறது. |
| நேர மு த்திரை துல்லியம் | நேர முத்திரைகள் தோராயமானவை (±3 நொடிகள்). வழிசெலுத்தலுக்கு பயன்படுத்துங்கள், சட்ட ஆவணங்களுக்கு அல்ல. |
| பதிவில் இடைநிறுத்தங்கள் | பதிவை இடைநிறுத்தினால், ஒலிப்பெயர்ப்பும் இடைநிறுத்தப்படுகிறது. இடைநிறுத்தப்பட்ட பகுதிகள் ஒலிப்பெயர்க்கப்படவில்லை. |
| துல்லியம் மாறும் | தெளிவான பேச்சு, ஒரே நேரத்தில் ஒரு பேச்சாளர் மற்றும் நல்ல மைக்ரோபோனுடன் துல்லியம் அதிகமாக இருக்கும். கனமான உச்சரிப்புகள், பின்னணி சத்தம் அல்லது குறுக்கீட்டு பேச்சு துல்லியத்தை குறைக்கும். |
| மொழி | ஒலிப்பெயர்ப்பு மொழியை தானாக கண்டறி (பரிந்துரைக்கப்படுகிறது) அல்லது அமைப்புகள் → AI → SeaMeet Integration-ல் குறிப்பிட்ட மொழியாக அமைக்கலாம். தானாக கண்டறி பன்மொழி கூட்டங்களை தானாகவே கையாளும். |
| நிகழ்நேர திருத்தம் இல்லை | பதிவு செய்யும்போது ஒலிப்பெயர்ப்பை திருத்த முடியாது. பதிவு நிறுத்திய பிறகு திருத்தம் கிடைக்கும். |
இயக்கத்தின்போது வசன மேலோட்டம்
நேரடி ஒலிப்பெயர்ப்புடன் பதிவை இயக்கும்போது, SeaMeet வீடியோவில் நேரடியாக வசனங்களை காட்டலாம் — TV-ல் மூடிய வசனங்கள் போல்.
வசனங்கள் எப்படி செயல்படுகின்றன:
- வசன உரை சட்டகத்தின் கீழ்ப்பகுதியில் வீடியோ முன்னோட்டத்தில் மேலோட்டமாக காட்டப்படுகிறது
- ஒவ்வொ ரு பகுதியும் பேச்சாளர் பெயர் (பேச்சாளர் வாரியாக நிறக்குறியீடு) மற்றும் பேசப்பட்ட உரையை காட்டுகிறது
- வசனங்கள் இயக்க நிலையுடன் ஒத்திசைவாக இருக்கும் — பதிவு இயங்கும்போது முன்னேறும்
- வசனங்கள் தானாகவே அமர்விலிருந்து Gemini Live ஒலிப்பெயர்ப்பை பயன்படுத்துகின்றன
பேச்சாளர் நிறங்கள்: ஒவ்வொரு பேச்சாளருக்கும் அனைத்து வசனங்கள் மற்றும் ஒலிப்பெயர்ப்பு பலகங்களில் நிலையான நிறம் ஒதுக்கப்படுகிறது. நிறங்கள் தானாகவே தீர்மானிக்கப்படுகின்றன மற்றும் பதிவு முழுவதும் நிலையானவை.
வசன வடிவம்:
[பேச்சாளர் 1]: குட் மார்னிங் எவ்ரிவன், ஆரம்பிக்கலாம்.
பொருந்தும் ஒலிப்பெயர்ப்பு பகுதி இயங்கும்போது வசனங்கள் தோன்றுகின்றன மற்றும் மறைகின்ற ன.
இரு-நெடுவரிசை வீடியோ அமைப்பு
நேரடி ஒலிப்பெயர்ப்புடன் வீடியோ பதிவை பார்க்கும்போது, SeaMeet இரு-நெடுவரிசை அமைப்பை பயன்படுத்துகிறது:
┌─────────────────────────────────────────────────────┐
│ வீடியோ முன்னோட்டம் │ ஒலிப்பெயர்ப்பு பலகம் │
│ │ │
│ [வசனங்களுடன் வீடியோ] │ பேச்சாளர் 1 0:00:12 │
│ │ "குட் மார்னிங்..." │
│ │ │
│ │ பேச்சாளர் 2 0:00:24 │
│ │ "சேர்ந்தமைக்கு நன்றி" │
│ │ [⤢ Max] │
└─────────────────────────────────────────────────────┘
- இடது நெடுவரிசை: வசன மேலோட்டத்துடன் நிலையான-அகல வீடியோ
- வலது நெடுவரிசை: இயக்க நிலையுடன் ஒத்திசைவான, நகரும் ஒலிப்பெயர்ப்பு பலகம்
- பெரிதாக்கு பொத்தான் (⤢): நீண்ட பதிவுகளை எளிதாக படிக்க ஒலிப்பெயர்ப்பு பலகத்தை முழுத்திரை மேலோட்டமாக விரிவாக்குகிறது
இரு-நெடுவரிசை அமைப்பு நேரடி ஒலிப்பெயர்ப்புகளுடன் வீடியோ பதிவுகளுக்கு மட்டும் தோன்றுகிறது. ஒலி மட்டும் பதிவுகள் மற்றும் ஒலிப்பெயர்ப்பு இல்லாத பதிவுகள் நிலையான ஒற்றை-நெடுவரிசை அமைப்பை பயன்படுத்துகின்றன.
ஒலிப்பெயர்ப்புக்கான மொழி அமைப்புகள்
நேரடி ஒலிப்பெயர்ப்பில் SeaMeet எந்த மொழியை எதிர்பார்க்கிறது என்று கட்டமைக்கலாம்:
- அமைப்புகள் (⚙️) திறக்கவும்
- AI → SeaMeet Integration-க்கு செல்லவும்
- கூட்ட மொழி தேர்வியை கண்டுபிடிக்கவும்
- உங்கள் மொழியை தேர்ந்தெடுக்கவும்:
- தானாக கண்டறி (இயல்புநிலை, பரிந்துரைக்கப்படுகிறது) — SeaMeet பேசப்படும் மொழியை தானாகவே அடையாளப்படுத்துகிறது. பன்மொழி கூட்டங்களுக்கு அல்லது மொழி மாறுமிடங்களுக்கு சிறந்தது.