Codex /goal 며칠씩 굴러가는 AI 에이전트 만드는 OpenAI 내부 비법 3가지

채널: 배움의 달인 (AI·자동화) | 길이: 10:42 | 업로드: 2026-05-13 원본: https://www.youtube.com/watch?v=6RdMjPYt84o

⚠️ 자막 미제공 영상입니다. 본 노트는 영상 자체 transcript가 아닌 description + chapter 메타데이터를 기반으로 정리했습니다. 세부 발언·예시 수치는 부정확할 수 있으니, 인용 시 원본 영상을 직접 확인하세요.

TL;DR

Codex/goal 모드는 단순 프롬프트가 아니라 자율 루프다. 루프가 작동하려면 종료 조건이 모든 것이며, 이를 잘못 설계하면 두 가지 실패 패턴(Stop Too Early / Never Stop)에 빠진다. OpenAI 내부에서 검증된 3가지 원칙은 ① 정량적 목표 설정(체크리스트화) ② 짧은 피드백 루프외부 메모리 3종 세트(experiments.md / plan.md / scratchpad)다. 같은 사고방식이 Claude Code, Cursor에도 그대로 적용된다.

핵심 통찰 (Insights)

  1. AI 에이전트의 자율성 = 종료 조건의 품질에 비례한다. 모델 능력이 아니라 종료 조건 설계가 엔지니어링의 본질이다. Stop Too Early와 Never Stop 양 극단을 피하는 균형이 곧 루프 설계의 핵심.

  2. 정량화는 자율 루프의 동력이다. 정성적 목표 그대로는 LLM이 “완료” 판단을 못 한다. NeurIPS→ICML 200개 규칙 사례는 평가의 자동화가 실제로 가능함을 보여준다.

  3. experiments.md = 단일 진실의 소스(SSOT). 분산된 LLM 호출 사이의 일관성 문제를 한 파일 동기화로 해결하는 우아한 접근. 이것이 가장 중요한 파일.

  4. 피드백 루프 길이는 에이전트의 학습률을 결정한다. 단순한 효율 개선이 아니라 시행착오 횟수 자체를 좌우하는 변수. 나노폴드 사례는 며칠짜리 채점을 몇 분으로 단축한 사례.

  5. 일반 원리이지 Codex 비법이 아니다. Claude Code, Cursor 등 모든 자율 코딩 에이전트에 동일하게 적용되는 패턴.

핵심 아이디어 (Ideas)

  • /goal 모드는 단순 프롬프트가 아닌 자율 루프(loop)다
  • 자율 루프의 핵심은 종료 조건(termination condition)
  • 종료 조건이 모호하면 두 가지 실패 패턴 발생
    • Stop Too Early: 목표 미달 상태로 조기 종료
    • Never Stop: 무한 루프로 빠지는 패턴
  • 원칙 ① 정량적 목표 — “정성적 → 정량적 체크리스트로 변환”
  • NeurIPS → ICML 사례에서 정성적 평가를 200개 규칙으로 정량화
  • 체크리스트가 있어야 LLM이 객관적으로 완료 여부 판단
  • 원칙 ② 짧은 피드백 루프 — “채점이 빠를수록 더 많은 시행착오”
  • 나노폴드(Nanofold) 사례: 며칠 채점 → 몇 분으로 단축
  • 원칙 ③ 외부 메모리 3종 세트
    • experiments.md — 단일 진실의 소스(Single Source of Truth)
    • plan.md — 작업 계획 시각화
    • experiments_note(scratchpad) — 일시적 사고 메모
  • 이 사고방식은 ‘바이브 코딩’ 이후의 진화된 단계
  • 작은 문제부터 시작해 점진적으로 확장하는 것이 안전
  • 자율 루프는 OpenAI Codex뿐 아니라 Claude Code, Cursor에서도 동일하게 통한다

사실 (Facts)

  • /goal은 OpenAI Codex의 슬래시 커맨드 (공식 문서: developers.openai.com/codex/use-cases/follow-goals)
  • 영상 길이: 10분 42초
  • NeurIPS→ICML 사례에서 약 200개 규칙 사용
  • 외부 메모리 파일 3종: experiments.md, plan.md, experiments_note(scratchpad)
  • 채널 구독자: 약 14,200명 (2026-05-13 기준)

실천 권고 (Recommendations)

  • 자율 루프를 시작하기 전 종료 조건을 먼저 정의하라
  • 정성적 평가는 200개 정도의 정량 규칙으로 분해하라
  • 채점 시간이 길면 피드백 루프부터 단축하라
  • experiments.md / plan.md / scratchpad 3종 세트를 항상 함께 사용하라
  • 시작은 반드시 작은 문제부터

챕터 (Chapters)

시간내용
00:00인트로 — 왜 평소 프롬프트 방식이 더 이상 안 통하나
00:57핵심 통찰 — Goal Mode = 루프, 종료 조건이 전부다
02:05실패 패턴 2가지 (Stop Too Early / Never Stop)
02:39원칙 ① 명확하고 정량적인 목표 설정법
03:58정성적 목표를 체크리스트로 바꾸는 NeurIPS→ICML 사례
05:07원칙 ② 짧은 피드백 루프 (나노폴드 사례)
06:09원칙 ③ 외부 메모리 — experiments.md, plan.md, scratchpad
08:16가장 중요한 파일: experiments.md (단일 진실의 소스)
09:11마무리 정리 — 3가지 원칙 체크리스트
09:56실전 적용 팁: 작은 문제부터 시작하기

관련 개념

관련 엔티티

참고 자료


원본 보존

  • 메타데이터: [[00-Inbox/youtube/6RdMjPYt84o_metadata.json]]
  • 영상 설명 원문: [[raw/inbox/youtube/6RdMjPYt84o_description]]