가이드

OpenAI 노드 가이드

작성일 2026.03.20 | 수정일 2026.03.24

OpenAI 노드 가이드

OpenAI 노드 가이드

OpenAI API를 사용하여 채팅 완성, 이미지 생성, 음성 생성, 비디오 생성을 수행하는 노드입니다.

주요 기능

리소스별 작업

리소스

작업

설명

Audio

Generate Speech

텍스트를 음성으로 변환 (TTS)

Chat

Complete

GPT 모델을 사용한 채팅 완성 (멀티턴 대화)

Image

Create

텍스트 프롬프트로 이미지 생성 (gpt-image, DALL-E)

Image

Edit

기존 이미지를 프롬프트로 편집

Video

Generate

텍스트 프롬프트로 비디오 생성 (Sora)

설정 항목

공통 설정

항목

타입

기본값

설명

Resource

선택

chat

사용할 리소스 (Audio, Chat, Image, Video)

Retry Count

숫자

3

API 호출 실패 시 재시도 횟수 (0~10)

Request Timeout

숫자

300

API 응답 최대 대기 시간 (초, 30~600)

Retry Delay

숫자

2

재시도 간 기본 대기 시간 (초, 지수 백오프 적용)

Audio > Generate Speech

항목

타입

기본값

설명

Model

선택

tts-1

TTS 모델 (tts-1, tts-1-hd, gpt-4o-mini-tts)

Input Text

문자열

-

음성으로 변환할 텍스트 (최대 4096자)

Voice

선택

alloy

음성 스타일 (alloy, ash, ballad, coral, echo, fable, nova, onyx, sage, shimmer, verse)

Instructions

문자열

-

음성 톤/감정 지시사항 (gpt-4o-mini-tts 전용)

Response Format

선택

mp3

출력 오디오 포맷 (mp3, opus, aac, flac, wav, pcm)

Speed

숫자

1.0

음성 속도 (0.25~4.0)

Chat > Complete

항목

타입

기본값

설명

Model

선택

gpt-5.4-mini

사용할 모델 선택

Prompt (Messages)

컬렉션

-

Role(System/User/Assistant)과 Content로 구성된 메시지 목록

Simplify

불리언

true

응답을 간소화하여 메시지만 반환

사용 가능 모델

모델

설명

gpt-5.4

최고 성능 플래그십 모델 (1M 컨텍스트, 128K 출력)

gpt-5.4-pro

전문가용 최상위 모델

gpt-5.4-mini

코딩, 에이전트에 최적화된 균형 모델 (400K 컨텍스트)

gpt-5.4-nano

가장 저렴한 GPT-5.4급 모델 (400K 컨텍스트)

gpt-4o

이전 세대 멀티모달 모델

gpt-4o-mini

이전 세대 경량 모델

gpt-4.1 / mini / nano

코딩 및 지시 따르기에 강한 모델 시리즈

o3, o4-mini

추론(reasoning) 특화 모델

Chat 옵션

항목

타입

기본값

설명

Frequency Penalty

숫자

0

반복 억제 패널티 (-2.0~2.0)

Maximum Number of Tokens

숫자

4096

생성할 최대 토큰 수 (최대 200,000)

Number of Completions

숫자

1

생성할 완성 수

Presence Penalty

숫자

0

새로운 주제 유도 패널티 (-2.0~2.0)

Sampling Temperature

숫자

1

무작위성 제어 (0.0~1.0)

Top P

숫자

1

핵 샘플링 (0.0~1.0)

Echo Prompt

불리언

false

완성과 함께 프롬프트도 반환

Image > Create

항목

타입

기본값

설명

Prompt

문자열

-

생성할 이미지에 대한 텍스트 설명

Model

선택

gpt-image-1.5

이미지 생성 모델

Response Format

선택

binaryData

반환 형식 (Binary File / Image URL)

Number of Images

숫자

1

생성할 이미지 수 (1~10)

이미지 모델별 옵션

옵션

gpt-image-1.5 / 1 / 1-mini

DALL-E 3

DALL-E 2

Quality

low / medium / high / auto

standard / hd

-

Resolution

1024x1024, 1536x1024, 1024x1536, auto

1024x1024, 1792x1024, 1024x1792

256x256, 512x512, 1024x1024

Output Format

png / jpeg / webp

-

-

Style

-

natural / vivid

-

gpt-image-1.5는 항상 바이너리(b64_json) 형태로 이미지를 반환합니다.

Image > Edit

항목

타입

기본값

설명

Image

문자열

data

편집할 이미지의 바이너리 속성 이름 (PNG, 4MB 이하, 정사각형)

Prompt

문자열

-

편집할 내용을 설명하는 텍스트

Model

선택

dall-e-2

편집 모델 (현재 DALL-E 2만 지원)

Mask

문자열

-

마스크 이미지의 바이너리 속성 이름 (선택사항)

Video > Generate

항목

타입

기본값

설명

Model

선택

sora-2

비디오 생성 모델 (sora-2, sora-2-pro)

Prompt

문자열

-

생성할 비디오에 대한 텍스트 설명

Duration

선택

8

비디오 길이 (8초, 16초, 20초)

Resolution

선택

1280x720

비디오 해상도 (모델별 옵션 상이)

비디오 모델별 해상도

모델

지원 해상도

sora-2

1280x720, 720x1280, 480x480

sora-2-pro

1920x1080, 1080x1920, 1280x720, 720x1280, 1024x1024

비디오 옵션

항목

타입

기본값

설명

Polling Interval

숫자

10

생성 상태 확인 간격 (초, 5~60)

Max Wait Time

숫자

600

완료 대기 최대 시간 (초, 60~1800)

Download Thumbnail

불리언

false

비디오와 함께 썸네일도 다운로드

비디오 생성은 비동기 방식입니다. 작업 요청 후 완료까지 자동으로 폴링합니다. 최대 대기 시간 초과 시 현재 상태를 warning과 함께 반환합니다.

인증 정보

이 노드는 OpenAI API 인증 정보가 필요합니다.

자세한 설정 방법은 OpenAI API 인증 설정 가이드를 참고하세요.

사용 예시

블로그 글 자동 생성

  1. Manual Trigger 노드로 워크플로우를 시작합니다.

  2. OpenAI 노드에서 Chat > Complete를 선택합니다.

  3. System 메시지에 "블로그 작성자 역할"을 지정하고, User 메시지에 주제를 입력합니다.

  4. 생성된 텍스트를 후속 노드에서 활용합니다.

이미지 생성 파이프라인

  1. 텍스트 프롬프트를 준비합니다.

  2. OpenAI 노드에서 Image > Create를 선택하고 gpt-image-1.5 모델을 사용합니다.

  3. Response Format을 Binary File로 설정하여 바이너리 데이터로 받습니다.

  4. AWS S3 노드를 사용하여 생성된 이미지를 저장합니다.

음성 생성 (TTS)

  1. 텍스트를 준비합니다.

  2. OpenAI 노드에서 Audio > Generate Speech를 선택합니다.

  3. 원하는 음성(Voice)과 모델을 선택합니다.

  4. gpt-4o-mini-tts 모델은 Instructions로 톤과 감정을 지정할 수 있습니다.

  5. 결과는 바이너리 오디오 파일로 반환됩니다.

비디오 생성 (Sora)

  1. 비디오 설명 프롬프트를 준비합니다.

  2. OpenAI 노드에서 Video > Generate를 선택합니다.

  3. sora-2 (빠른 생성) 또는 sora-2-pro (고품질 1080p)를 선택합니다.

  4. 생성 완료까지 자동으로 대기하며, 결과는 mp4 바이너리로 반환됩니다.

참고 사항

  • 커스텀 API 엔드포인트를 인증 정보에서 설정할 수 있어, OpenAI 호환 API 서버에도 사용 가능합니다.

  • 재시도 로직에 지수 백오프(exponential backoff)가 적용되어, 429(Rate Limit), 5xx(서버 에러) 등의 일시적 오류를 자동 복구합니다.

  • Simplify 옵션을 활성화하면 응답에서 핵심 데이터(메시지)만 추출하여 후속 노드에서 다루기 쉽습니다.

  • 토큰 사용량 정보(_usage)가 간소화된 응답에도 포함됩니다 (과금 추적용).

  • gpt-image-1.5 모델은 DALL-E 대비 높은 품질의 이미지를 생성하며, 최대 10장까지 생성 가능합니다.

  • 비디오 생성은 비동기 API로 작동하여 생성에 수 분이 소요될 수 있습니다.