AI를
팀으로 운영하는 법
단일 AI에서 멀티 에이전트로. 이 Stage는 커리큘럼 전체를 한 단계 위로 올려주는 고급 과정입니다. 장PM이 말한 하네스 엔지니어링의 최고 수준 — AI 한 명을 시키는 것에서 AI 팀을 운영하는 것으로.
MCP 실전 — 5개 핵심 연결
충전선 USB-C 비유 — Anthropic이 만든 AI ↔ 외부 서비스 연결 표준 규격
Stage 1에서 도구 지도를 봤다면, Stage 7에서 n8n MCP를 한 개 연결했다면, 이제 핵심 5개를 동시에 깔아둡니다. MCP는 충전선 USB-C와 같습니다. 한 번 표준이 정해지면 모든 기기가 그걸 통해 연결됩니다.
Subagents & HITL
자비스 라우터 심화 — 한 명의 AI가 아닌 AI 팀의 운영자가 되기
Stage 5에서 자비스 라우터 개념을 봤습니다. 이제 실제 구현입니다. 메인 에이전트(오케스트레이터)가 작업을 파악해서 적절한 서브에이전트에게 위임하고, 각 서브는 자기 분야만 깊게 파고들면서, 서로 직접 통신하지 않고 메인을 통해 조율됩니다.
+ 요약
초안 작성
+ 팩트체크
실행
리서처: 외부 뉴스 API 호출 + Claude 요약 (다른 에이전트와 무관)
라이터: 리서처 결과를 받아 뉴스레터 톤으로 변환 + 헤드라인 생성
리뷰어: 라이터 결과 검토. 오타·팩트·길이 체크. 통과 못하면 라이터에게 재작업 요청 (오케스트레이터 통해)
퍼블리셔: 리뷰 통과한 결과만 받아 Resend 발송. 절대 자체 검증 X.
"모든 걸 자동화"가 답이 아닙니다. 틀리면 비싼 작업, 사람의 판단이 필요한 작업, 책임이 큰 작업은 반드시 사람 승인을 거칩니다. HITL 결정 매트릭스로 명확히 구분.
• 환영 이메일 발송 (템플릿 고정)
• 텔레그램 시스템 알림
• 발송 로그 기록
• 주간 지표 수집·집계
• 환불·결제 취소 처리
• 새 가격 정책·이벤트
• 유료 광고 카피 발행
• 약관·개인정보 처리방침 변경
2. 비용이 큰가? 잘못 발송 시 영향받는 사용자 수 × 손해. 100명 이상이면 HITL.
3. 정책·법적 의미가 있나? 환불·약관·결제는 무조건 HITL.
RAG + Dify 연동
"내 문서로 답하는 AI" — 살아있는 지식베이스를 30분에 만들기
RAG(Retrieval-Augmented Generation)는 "AI가 모르는 내 문서를 미리 찾아본 뒤 답하게 만드는 기술"입니다. 일반 Claude는 일반 지식만 알지만, RAG Claude는 내 회사 문서·내 발행한 뉴스레터·내 내부 매뉴얼을 보고 답합니다.
✗ 내 회사 정보 모름
✗ 어제 뉴스 모름
✗ 내 뉴스레터 아카이브 모름
✗ "지난주 발행한 IT 트렌드 뭐였어?" → 모름
✓ 어제 발행한 뉴스레터 인지
✓ 사용자별 구독 이력 활용
✓ 출처(어떤 문서) 함께 답변
✓ "지난주 IT 트렌드" → 정확히 답변
RAG의 핵심은 벡터 DB. 키워드가 아니라 "의미"로 비슷한 문서를 찾는 검색기. "AI 트렌드"로 검색해도 "인공지능 동향" 문서를 찾아냅니다. Dify가 이 복잡한 부분을 다 해줍니다.
지식베이스 생성
·URL 첨부
(LLM 선택)
외부 호출 가능
구독자 질문: "지난주 AI 트렌드 핵심 3개만 알려줘"
RAG 동작: 벡터 DB에서 "AI 트렌드" 의미 매칭 → 지난주 뉴스레터 3편 검색 → Claude에 컨텍스트로 주입 → "출처: 5/12 발행분, 5/14 발행분..." 함께 답변
구독자가 자기 마이페이지에서 자기만의 큐레이션을 받는 차별화 포인트.
지금 보고 있는 이 페이지의 AI 튜터는 일반 Claude API를 호출합니다. 9개 Stage HTML 파일 전체를 Dify 지식베이스에 올리면, AI 튜터가 VIBE MASTER 전체 커리큘럼을 알고 답하는 RAG 챗봇으로 업그레이드됩니다.
이후: "Karpathy 4원칙 알려줘" → "Stage 3 섹션 1에서 다뤘듯이..." + Stage 5 적용 사례까지 연결
커리큘럼 학습자가 9개 Stage를 횡단하며 질문할 수 있게 됩니다.
에이전트 거버넌스
"AI 팀이 폭주하지 않게 하는 헌법" — 권한·감사·복구 3종 세트
멀티에이전트 시스템은 강력한 만큼 위험합니다. "AI가 production DB를 wipe했다", "잘못된 가격 메일이 1만 명에게 갔다"가 진짜 일어납니다. 거버넌스는 그걸 막는 안전벨트입니다.
rm -rf 같은 명령을 무비판적으로 실행 가능2. 권한 범위가 모호하면 발송 에이전트가 결제 데이터까지 건드릴 수 있음
3. 사고 발생 시 "누가 무엇을 언제 했는지"를 추적 못하면 재발 방지 불가
거버넌스 = settings.json + 권한 정의 + 감사 로그 + Checkpoint·Rewind
| 도구 | 역할 | 실전 적용 |
|---|---|---|
| settings.json Hooks | 위험 명령 자동 차단 | PreToolUse: rm/git push --force/.env 수정 차단 |
| 권한 범위 정의 | 에이전트별 행동 제한 | AGENT.md에 [forbidden] 섹션 + Supabase RLS |
| 감사 로그 | "누가 언제 무엇을 했나" 기록 | send_logs + agent_audit_logs 테이블 (모든 행동 기록) |
| Checkpoint + Rewind | 실패 시 이전 상태로 되돌리기 | Claude Code Esc+Esc + Harness pending 재시도 |
컨텍스트 엔지니어링 심화 — 메타 프롬프팅
"프롬프트가 프롬프트를 만드는 구조" — 자가 발전하는 시스템
메타 프롬프팅은 "AI에게 프롬프트를 만들게 하는 프롬프트"입니다. 한 단계 위. 자기 검증 루프와 결합하면 시간이 갈수록 더 나은 프롬프트로 진화하는 시스템이 됩니다.
/autoresearch SKILL이 여기서 빛납니다.흐름: 새 SKILL 작성 → autoresearch가 자동으로 분석 → 약점·누락 진단 → 개선안 제시 → 적용 → 다시 검증.
시간이 갈수록 SKILL 품질이 자동으로 올라가는 자가 진화 시스템. 한 달 후 동일 SKILL은 처음보다 50% 정확.
레벨 2: "이 뉴스레터를 더 좋게 만들 프롬프트를 짜줘" → 메타 프롬프트 생성
레벨 3: 그 메타 프롬프트로 다시 작성 → 비교 → 더 나은 것 채택
레벨 4: 그 결과를 reflect로 CLAUDE.md에 패턴으로 저장
매번 같은 작업이 매번 더 나아집니다. 6개월 후 첫 달과 비교하면 품질 차이가 압도적.
integration/dify.mdAGENT.md + GOVERNANCE.md~/.claude/settings.jsonDify RAG는 Stage 9에서 성장 분석에 활용됩니다 — PostHog 데이터 + Stripe 매출 + 사용자 피드백을 모두 RAG로 분석. 멀티에이전트 + 거버넌스는 VIBE MASTER 자체가 AI에 의해 운영·발전되는 살아있는 커리큘럼으로 진화하는 토대입니다. 이 Stage가 끝나면 학습자에서 운영자로 전환됩니다.