가이드

Gemini 음성 합성 (TTS) 노드 가이드

작성일 2026.03.20 | 수정일 2026.03.20

Gemini 음성 합성 (TTS) 노드 가이드

Google Gemini API의 네이티브 텍스트 음성 변환 기능을 사용하여 텍스트를 음성으로 변환하는 노드입니다.

주요 기능

음성 합성 기능

작업

설명

음성 합성

텍스트를 자연스러운 음성으로 변환하여 오디오 파일 생성

설정 항목

기본 설정

기본 설정 항목

항목

타입

기본값

설명

텍스트

문자열

-

음성으로 변환할 텍스트 (필수)

모델

선택

gemini-2.5-flash-preview-tts

사용할 TTS 모델

음성 설정

선택

단일 화자

단일 화자 또는 다중 화자 모드

바이너리 속성 이름

문자열

audio

생성된 오디오를 저장할 바이너리 속성 이름

사용 가능한 모델

TTS 모델 목록

모델

설명

Gemini 2.5 Flash Preview TTS

빠르고 비용 효율적인 TTS 모델 (권장)

Gemini 2.5 Flash Lite Preview TTS

가장 가벼운 TTS 모델 (최저 비용)

Gemini 2.5 Pro Preview TTS

고품질 TTS 모델

스타일 가이드

스타일 가이드를 사용하여 음성의 톤, 속도, 억양을 제어할 수 있습니다.

스타일 가이드 모드

모드

설명

없음

기본 음성으로 변환

프리셋 스타일

미리 정의된 스타일 선택

사용자 정의 프롬프트

자연어로 직접 스타일 지시 작성

프리셋 스타일 목록

사용 가능한 프리셋 스타일

스타일

설명

Cheerful

밝고 활기차게

Calm

차분하고 부드럽게

Serious

진지하고 단호하게

Slow

천천히 또박또박

Fast

빠르게

Whisper

속삭이듯

Excited

흥분되게

Sad

슬프게

Professional

전문적으로

Friendly

친근하게

Narrative

내레이션 스타일

News Anchor

뉴스 앵커 스타일

음성 선택

단일 화자 모드에서는 음성을 선택할 수 있습니다.

음성 선택 방식

입력 방식

설명

목록에서 선택

드롭다운에서 음성 선택 (Puck, Charon, Kore, Fenrir, Aoede 등)

사용자 정의 표현식

직접 입력 또는 표현식 사용 (예: {{ $json.voiceName }})

재시도 설정

재시도 설정 항목

항목

타입

기본값

설명

재시도 횟수

숫자

3

API 요청 실패 시 재시도 횟수

재시도 지연 (초)

숫자

60

재시도 사이 대기 시간

인증 정보

이 노드는 Gemini API 인증 정보가 필요합니다.

자세한 설정 방법은 Gemini API 인증 설정 가이드를 참고하세요.

사용 예시

기본 음성 합성

  1. Gemini TTS 노드를 추가합니다.

  2. 텍스트 필드에 변환할 내용을 입력합니다.

  3. 원하는 음성을 선택합니다 (예: Puck).

  4. 실행하면 audio 바이너리 속성에 WAV 오디오 파일이 생성됩니다.

스타일이 적용된 내레이션

  1. 스타일 가이드 모드를 프리셋 스타일로 설정합니다.

  2. Narrative 내레이션 스타일을 선택합니다.

  3. 텍스트에 내레이션 대본을 입력합니다.

  4. 오디오북 스타일의 음성이 생성됩니다.

다중 화자 대화

  1. 음성 설정을 다중 화자로 선택합니다.

  2. 텍스트에 화자 마크업을 포함하여 입력합니다.

  3. 여러 화자의 음성이 자동으로 적용됩니다.

동적 음성 선택

  1. 음성 입력 모드를 사용자 정의 표현식으로 설정합니다.

  2. 음성 이름에 {{ $json.voiceName }}과 같은 표현식을 사용합니다.

  3. 이전 노드의 데이터에 따라 다른 음성으로 합성할 수 있습니다.

참고 사항

  • 출력 형식은 WAV입니다. Gemini API가 PCM 데이터를 반환하면 자동으로 WAV 헤더가 추가됩니다.

  • 사용자 정의 프롬프트 모드에서는 영어로 스타일을 지시하는 것이 가장 효과적입니다 (예: Say warmly and slowly)

  • 재시도 지연은 기본 60초로 설정되어 있습니다. Rate limit 오류 시 충분한 대기 시간이 필요합니다.

  • 토큰 사용량 정보 (_usage)가 출력 JSON에 포함되어 비용 추적이 가능합니다.

  • 시스템 증명서를 통해 별도의 API 키 없이도 사용할 수 있습니다 (비용 별도 정산).