ChatGPT API 프롬프트 캐싱으로 비용 최대 50% 절감하기 완벽 가이드
ChatGPT API를 사용하다 보면 반복되는 프롬프트로 인한 비용 부담이 커지게 됩니다. OpenAI는 이러한 문제를 해결하기 위해 프롬프트 캐싱(Prompt Caching) 기능을 도입했습니다. 이 글에서는 프롬프트 캐싱을 통해 API 비용을 효율적으로 절감하는 방법을 상세히 알아보겠습니다.
프롬프트 캐싱 (Prompt Caching) 이란?
프롬프트 캐싱은 동일한 입력 토큰이 반복해서 사용될 때 이를 재활용하여 비용을 절감하는 기능입니다. 특히 다음과 같은 상황에서 효과적입니다:
- 코드베이스 분석 시 동일한 컨텍스트 재사용
- 챗봇의 다중 턴 대화에서 이전 대화 컨텍스트 유지
- 템플릿 기반의 반복적인 텍스트 생성
- 대규모 문서 처리 시 공통된 지시사항 활용
지원 모델 및 가격 정책
지원 모델
현재 프롬프트 캐싱은 다음 모델들에서 자동으로 적용됩니다:
- GPT-4o (gpt-4o-2024-08-06)
- GPT-4o mini (gpt-4o-mini-2024-07-18)
- o1-preview
- o1-mini
위 모델들의 파인튜닝 버전
프롬프트 캐싱 가격 정책
캐시된 입력 토큰에 대해 50% 할인이 적용됩니다:
모델 | 일반 가격 | 캐시 적용 가격 |
---|---|---|
GPT-4o | $2.50 | $1.25 |
GPT-4o mini | $0.15 | $0.075 |
o1-preview | $15.00 | $7.50 |
o1-mini | $3.00 | $1.50 |
프롬프트 캐싱 구현하기
1. 기본 설정
프롬프트 캐싱은 별도의 설정 없이 자동으로 적용됩니다. 단, 다음 조건을 충족해야 합니다:
const configuration = new Configuration({
apiKey: process.env.OPENAI_API_KEY,
});
const openai = new OpenAIApi(configuration);