OpenAI 노드 가이드

OpenAI 노드 가이드
OpenAI API를 사용하여 채팅 완성, 이미지 생성, 음성 생성, 비디오 생성을 수행하는 노드입니다.
주요 기능
리소스별 작업
리소스 | 작업 | 설명 |
|---|---|---|
Audio | Generate Speech | 텍스트를 음성으로 변환 (TTS) |
Chat | Complete | GPT 모델을 사용한 채팅 완성 (멀티턴 대화) |
Image | Create | 텍스트 프롬프트로 이미지 생성 (gpt-image, DALL-E) |
Image | Edit | 기존 이미지를 프롬프트로 편집 |
Video | Generate | 텍스트 프롬프트로 비디오 생성 (Sora) |
설정 항목
공통 설정
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Resource | 선택 |
| 사용할 리소스 (Audio, Chat, Image, Video) |
Retry Count | 숫자 |
| API 호출 실패 시 재시도 횟수 (0~10) |
Request Timeout | 숫자 |
| API 응답 최대 대기 시간 (초, 30~600) |
Retry Delay | 숫자 |
| 재시도 간 기본 대기 시간 (초, 지수 백오프 적용) |
Audio > Generate Speech
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Model | 선택 |
| TTS 모델 (tts-1, tts-1-hd, gpt-4o-mini-tts) |
Input Text | 문자열 | - | 음성으로 변환할 텍스트 (최대 4096자) |
Voice | 선택 |
| 음성 스타일 (alloy, ash, ballad, coral, echo, fable, nova, onyx, sage, shimmer, verse) |
Instructions | 문자열 | - | 음성 톤/감정 지시사항 (gpt-4o-mini-tts 전용) |
Response Format | 선택 |
| 출력 오디오 포맷 (mp3, opus, aac, flac, wav, pcm) |
Speed | 숫자 |
| 음성 속도 (0.25~4.0) |
Chat > Complete
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Model | 선택 |
| 사용할 모델 선택 |
Prompt (Messages) | 컬렉션 | - | Role(System/User/Assistant)과 Content로 구성된 메시지 목록 |
Simplify | 불리언 |
| 응답을 간소화하여 메시지만 반환 |
사용 가능 모델
모델 | 설명 |
|---|---|
gpt-5.4 | 최고 성능 플래그십 모델 (1M 컨텍스트, 128K 출력) |
gpt-5.4-pro | 전문가용 최상위 모델 |
gpt-5.4-mini | 코딩, 에이전트에 최적화된 균형 모델 (400K 컨텍스트) |
gpt-5.4-nano | 가장 저렴한 GPT-5.4급 모델 (400K 컨텍스트) |
gpt-4o | 이전 세대 멀티모달 모델 |
gpt-4o-mini | 이전 세대 경량 모델 |
gpt-4.1 / mini / nano | 코딩 및 지시 따르기에 강한 모델 시리즈 |
o3, o4-mini | 추론(reasoning) 특화 모델 |
Chat 옵션
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Frequency Penalty | 숫자 |
| 반복 억제 패널티 (-2.0~2.0) |
Maximum Number of Tokens | 숫자 |
| 생성할 최대 토큰 수 (최대 200,000) |
Number of Completions | 숫자 |
| 생성할 완성 수 |
Presence Penalty | 숫자 |
| 새로운 주제 유도 패널티 (-2.0~2.0) |
Sampling Temperature | 숫자 |
| 무작위성 제어 (0.0~1.0) |
Top P | 숫자 |
| 핵 샘플링 (0.0~1.0) |
Echo Prompt | 불리언 |
| 완성과 함께 프롬프트도 반환 |
Image > Create
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Prompt | 문자열 | - | 생성할 이미지에 대한 텍스트 설명 |
Model | 선택 |
| 이미지 생성 모델 |
Response Format | 선택 |
| 반환 형식 (Binary File / Image URL) |
Number of Images | 숫자 |
| 생성할 이미지 수 (1~10) |
이미지 모델별 옵션
옵션 | gpt-image-1.5 / 1 / 1-mini | DALL-E 3 | DALL-E 2 |
|---|---|---|---|
Quality | low / medium / high / auto | standard / hd | - |
Resolution | 1024x1024, 1536x1024, 1024x1536, auto | 1024x1024, 1792x1024, 1024x1792 | 256x256, 512x512, 1024x1024 |
Output Format | png / jpeg / webp | - | - |
Style | - | natural / vivid | - |
gpt-image-1.5는 항상 바이너리(b64_json) 형태로 이미지를 반환합니다.
Image > Edit
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Image | 문자열 |
| 편집할 이미지의 바이너리 속성 이름 (PNG, 4MB 이하, 정사각형) |
Prompt | 문자열 | - | 편집할 내용을 설명하는 텍스트 |
Model | 선택 |
| 편집 모델 (현재 DALL-E 2만 지원) |
Mask | 문자열 | - | 마스크 이미지의 바이너리 속성 이름 (선택사항) |
Video > Generate
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Model | 선택 |
| 비디오 생성 모델 (sora-2, sora-2-pro) |
Prompt | 문자열 | - | 생성할 비디오에 대한 텍스트 설명 |
Duration | 선택 |
| 비디오 길이 (8초, 16초, 20초) |
Resolution | 선택 |
| 비디오 해상도 (모델별 옵션 상이) |
비디오 모델별 해상도
모델 | 지원 해상도 |
|---|---|
sora-2 | 1280x720, 720x1280, 480x480 |
sora-2-pro | 1920x1080, 1080x1920, 1280x720, 720x1280, 1024x1024 |
비디오 옵션
항목 | 타입 | 기본값 | 설명 |
|---|---|---|---|
Polling Interval | 숫자 |
| 생성 상태 확인 간격 (초, 5~60) |
Max Wait Time | 숫자 |
| 완료 대기 최대 시간 (초, 60~1800) |
Download Thumbnail | 불리언 |
| 비디오와 함께 썸네일도 다운로드 |
비디오 생성은 비동기 방식입니다. 작업 요청 후 완료까지 자동으로 폴링합니다. 최대 대기 시간 초과 시 현재 상태를 warning과 함께 반환합니다.
인증 정보
이 노드는 OpenAI API 인증 정보가 필요합니다.
자세한 설정 방법은 OpenAI API 인증 설정 가이드를 참고하세요.
사용 예시
블로그 글 자동 생성
Manual Trigger 노드로 워크플로우를 시작합니다.
OpenAI 노드에서 Chat > Complete를 선택합니다.
System 메시지에 "블로그 작성자 역할"을 지정하고, User 메시지에 주제를 입력합니다.
생성된 텍스트를 후속 노드에서 활용합니다.
이미지 생성 파이프라인
텍스트 프롬프트를 준비합니다.
OpenAI 노드에서 Image > Create를 선택하고 gpt-image-1.5 모델을 사용합니다.
Response Format을 Binary File로 설정하여 바이너리 데이터로 받습니다.
AWS S3 노드를 사용하여 생성된 이미지를 저장합니다.
음성 생성 (TTS)
텍스트를 준비합니다.
OpenAI 노드에서 Audio > Generate Speech를 선택합니다.
원하는 음성(Voice)과 모델을 선택합니다.
gpt-4o-mini-tts 모델은 Instructions로 톤과 감정을 지정할 수 있습니다.
결과는 바이너리 오디오 파일로 반환됩니다.
비디오 생성 (Sora)
비디오 설명 프롬프트를 준비합니다.
OpenAI 노드에서 Video > Generate를 선택합니다.
sora-2 (빠른 생성) 또는 sora-2-pro (고품질 1080p)를 선택합니다.
생성 완료까지 자동으로 대기하며, 결과는 mp4 바이너리로 반환됩니다.
참고 사항
커스텀 API 엔드포인트를 인증 정보에서 설정할 수 있어, OpenAI 호환 API 서버에도 사용 가능합니다.
재시도 로직에 지수 백오프(exponential backoff)가 적용되어, 429(Rate Limit), 5xx(서버 에러) 등의 일시적 오류를 자동 복구합니다.
Simplify옵션을 활성화하면 응답에서 핵심 데이터(메시지)만 추출하여 후속 노드에서 다루기 쉽습니다.토큰 사용량 정보(
_usage)가 간소화된 응답에도 포함됩니다 (과금 추적용).gpt-image-1.5 모델은 DALL-E 대비 높은 품질의 이미지를 생성하며, 최대 10장까지 생성 가능합니다.
비디오 생성은 비동기 API로 작동하여 생성에 수 분이 소요될 수 있습니다.