메인-서브 에이전트 이중 구조

통합 인터페이스·기억·페르소나를 담당하는 메인 에이전트와, 특정 작업(주로 코딩)에 특화된 서브 에이전트를 분리해 백엔드처럼 호출하는 운영 아키텍처.

구조

사용자
  │
  ▼
[메인 에이전트] ([[wiki/entities/Hermes-에이전트]] / [[wiki/entities/오픈클로]])
  - 사용자 페르소나 기억
  - 채널 통합 (Slack/Telegram)
  - 스킬·메모리 관리
  │
  ▼ CLI 호출 / 백엔드 위임
[서브 에이전트] ([[wiki/entities/openai-codex|Codex]] / [[wiki/entities/claude-code|Claude Code]])
  - 코드 작성·리팩터링
  - 파일 조작
  - 명시적 작업 단위

왜 분리하는가

메인 에이전트 강점서브 에이전트 강점
사용자 컨텍스트 유지코드 작업 특화
채널 통합 (Slack/Telegram)명확한 작업 단위
스킬·메모리 누적빠른 실행
페르소나 시스템강력한 CLI

통합 인터페이스의 안정성전문 처리 능력을 디커플링한다. 메인이 끊겨도 서브는 독립 실행 가능.

호출 패턴

  1. 사용자 → 메인 (자연어 요청, 컨텍스트 포함)
  2. 메인 → 작업 분류 → “코딩 관련” 판단
  3. 메인 → 서브 CLI 호출 (codex install ..., claude-code run ...)
  4. 서브 → 작업 수행 → 결과 반환
  5. 메인 → 결과 정리 → 사용자에게 보고 (페르소나 어조 적용)

영상에서 단테는 /board, /meeting 플러그인 설치를 Codex에게 위임:

  • 메인(Hermes): “이 플러그인 설치 가이드해 줘”
  • 서브(Codex): GitHub clone, 설정 파일 작성, Slack 매니페스트 생성

운영 이점

  • 메인의 모델 변경 자유도: 서브가 코딩 전담이라 메인은 저렴한 일반 모델 사용 가능
  • 장애 격리: 서브 CLI 실패가 메인 페르소나에 영향 X
  • 스킬 위임: 새 스킬 설치도 서브가 처리 (메인은 지시만)
  • 비용 최적화: 코딩 토큰 비용은 서브에만 집중

안티 패턴

  • 메인 에이전트가 코드 작성까지 직접 — 컨텍스트 오염, 비용 증가
  • 서브 에이전트가 사용자와 직접 대화 — 페르소나·기억 분실
  • 메인/서브 모델을 같은 비싼 모델로 묶기 — 비용 비효율

사례

관련 노트

출처