Gemini 음성 합성 (TTS) 노드 가이드

Google Gemini API의 네이티브 텍스트 음성 변환 기능을 사용하여 텍스트를 음성으로 변환하는 노드입니다.
주요 기능
음성 합성 기능
작업 | 설명 |
|---|---|
음성 합성 | 텍스트를 자연스러운 음성으로 변환하여 오디오 파일 생성 |
설정 항목
기본 설정
기본 설정 항목
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
텍스트 | 문자열 | - | 음성으로 변환할 텍스트 (필수) |
모델 | 선택 |
| 사용할 TTS 모델 |
음성 설정 | 선택 |
| 단일 화자 또는 다중 화자 모드 |
바이너리 속성 이름 | 문자열 |
| 생성된 오디오를 저장할 바이너리 속성 이름 |
사용 가능한 모델
TTS 모델 목록
모델 | 설명 |
|---|---|
Gemini 2.5 Flash Preview TTS | 빠르고 비용 효율적인 TTS 모델 (권장) |
Gemini 2.5 Flash Lite Preview TTS | 가장 가벼운 TTS 모델 (최저 비용) |
Gemini 2.5 Pro Preview TTS | 고품질 TTS 모델 |
스타일 가이드
스타일 가이드를 사용하여 음성의 톤, 속도, 억양을 제어할 수 있습니다.
스타일 가이드 모드
모드 | 설명 |
|---|---|
없음 | 기본 음성으로 변환 |
프리셋 스타일 | 미리 정의된 스타일 선택 |
사용자 정의 프롬프트 | 자연어로 직접 스타일 지시 작성 |
프리셋 스타일 목록
사용 가능한 프리셋 스타일
스타일 | 설명 |
|---|---|
Cheerful | 밝고 활기차게 |
Calm | 차분하고 부드럽게 |
Serious | 진지하고 단호하게 |
Slow | 천천히 또박또박 |
Fast | 빠르게 |
Whisper | 속삭이듯 |
Excited | 흥분되게 |
Sad | 슬프게 |
Professional | 전문적으로 |
Friendly | 친근하게 |
Narrative | 내레이션 스타일 |
News Anchor | 뉴스 앵커 스타일 |
음성 선택
단일 화자 모드에서는 음성을 선택할 수 있습니다.
음성 선택 방식
입력 방식 | 설명 |
|---|---|
목록에서 선택 | 드롭다운에서 음성 선택 (Puck, Charon, Kore, Fenrir, Aoede 등) |
사용자 정의 표현식 | 직접 입력 또는 표현식 사용 (예: |
재시도 설정
재시도 설정 항목
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
재시도 횟수 | 숫자 |
| API 요청 실패 시 재시도 횟수 |
재시도 지연 (초) | 숫자 |
| 재시도 사이 대기 시간 |
인증 정보
이 노드는 Gemini API 인증 정보가 필요합니다.
자세한 설정 방법은 Gemini API 인증 설정 가이드를 참고하세요.
사용 예시
기본 음성 합성
Gemini TTS 노드를 추가합니다.
텍스트 필드에 변환할 내용을 입력합니다.
원하는 음성을 선택합니다 (예: Puck).
실행하면
audio바이너리 속성에 WAV 오디오 파일이 생성됩니다.
스타일이 적용된 내레이션
스타일 가이드 모드를 프리셋 스타일로 설정합니다.
Narrative 내레이션 스타일을 선택합니다.
텍스트에 내레이션 대본을 입력합니다.
오디오북 스타일의 음성이 생성됩니다.
다중 화자 대화
음성 설정을 다중 화자로 선택합니다.
텍스트에 화자 마크업을 포함하여 입력합니다.
여러 화자의 음성이 자동으로 적용됩니다.
동적 음성 선택
음성 입력 모드를 사용자 정의 표현식으로 설정합니다.
음성 이름에
{{ $json.voiceName }}과 같은 표현식을 사용합니다.이전 노드의 데이터에 따라 다른 음성으로 합성할 수 있습니다.
참고 사항
출력 형식은 WAV입니다. Gemini API가 PCM 데이터를 반환하면 자동으로 WAV 헤더가 추가됩니다.
사용자 정의 프롬프트 모드에서는 영어로 스타일을 지시하는 것이 가장 효과적입니다 (예: Say warmly and slowly)
재시도 지연은 기본 60초로 설정되어 있습니다. Rate limit 오류 시 충분한 대기 시간이 필요합니다.
토큰 사용량 정보 (
_usage)가 출력 JSON에 포함되어 비용 추적이 가능합니다.시스템 증명서를 통해 별도의 API 키 없이도 사용할 수 있습니다 (비용 별도 정산).