사용자 100명까진 신경 안 써도 됩니다. 1,000명 넘기 시작하면 두 가지가 폭발 — 응답 속도와 AI API 비용. 이 페이지로 둘 다 잡습니다.
월 $300 → $90 가능. 단 한 가지 패턴(프롬프트 캐싱)이 절반
시스템 prompt + 첨부 문서를 캐시 → 반복 호출 시 90% 비용 절감
Anthropic의 Prompt Caching은 cache_control 마커를 추가하면 자동 동작. 같은 시스템 prompt·문서를 반복해서 보낼 때 5분 동안 90% 할인 (cached 토큰 $0.30/M, 일반 $3/M).
"하나로 다" 안 됨. 5배 비싼 opus를 단순 작업에 쓰는 건 낭비
SEO 점수에 직접 반영. Vercel은 절반 자동, 나머지 절반은 우리가
next/font로 (FOUT 방지·preload)next/script + strategy="lazyOnload"사용자 100명까지 자동, 1,000명 넘으면 인덱스 필수
| 층 | 도구 | 대상 | TTL 추천 |
|---|---|---|---|
| 1. 브라우저 | HTTP Cache-Control 헤더 | 정적 자산 (JS·CSS·이미지) | 1년 (immutable) |
| 2. CDN | Vercel Edge Cache | SSG·ISR 페이지·이미지 | 1시간 ~ 1일 |
| 3. 서버 | Vercel KV / Upstash Redis | API 응답·세션·rate limit | 1분 ~ 1시간 |
| 4. DB | Supabase 자동 (PostgreSQL) | 쿼리 plan·인덱스 | 자동 |
"어디서 새는지 모르면 못 막음" — 정기 점검 의식