꼭 알아야할 안드레 카파시 30분 인터뷰 완전정리 - AI시대의 필수 인사이트!
Andrej-Karpathy가 Sequoia-Capital에서 진행한 30분 인터뷰를 김플립-LLM-코딩 채널이 11개 섹션으로 정리·해설한 영상. 발행일 2026-05-05, 22,230회 조회.
TL;DR
- 2025년 12월이 에이전트 코딩의 진정한 분기점 — 계단형 도약
- 우리는 Software-1-2-3-0 시대에 있다 (코드 → 신경망 훈련 → 프롬프트)
- AI는 검증-가능성의-법칙에 따라 채점 가능한 영역에서만 천재 → Jagged-Intelligence
- 바이브-코딩 (바닥 ↑) vs Agentic-Engineering (천장 ↑)
- LLM은 동물이 아니라 유령-비유 — 진화 산물이 아닌 통계 산물
- Thinking은 아웃소싱 가능, Understanding은 아웃소싱 불가능 → Thinking-vs-Understanding
11개 섹션 요약
1. 2025년 12월이 분기점이었다 (00:41)
- 카파시는 1년 가까이 Claude-Code 같은 에이전트를 써왔지만, 그 1년 동안의 경험은 “코드 덩어리를 던져 주면 가끔 맞고 가끔 직접 고쳐야 하는” 수준
- 12월에 휴가가 생겨 최신 모델로 다시 돌려봤더니 “그냥 코드가 나오는” 경험 — 시스템을 신뢰하기 시작
- 핵심 메시지: “작년에 ChatGPT 정도 수준에서 AI를 경험했다면 12월부터는 다시 봐야 한다”
- AI 발전은 곡선이 아니라 계단형 분기점으로 끊어진다
2. Software 1.0 → 2.0 → 3.0 (02:58)
| 단계 | 방식 |
|---|---|
| 1.0 | 직접 코드 작성 |
| 2.0 | 신경망 훈련 (데이터셋·아키텍처 설계) |
| 3.0 | 프롬프트 작성 = 프로그래밍, 컨텍스트 윈도우가 레버 |
OpenClo 설치 사례: 옛날 같으면 OS별 bash 스크립트 분기 처리 필요 → 지금은 텍스트 한 덩어리를 에이전트에 붙여 넣으면 끝.
MenuGen 사례 (충격적): 카파시 본인 사이드 프로젝트(메뉴 사진 → OCR → 이미지 생성)가 Nano-Banana의 등장으로 통째로 불필요해짐. “메뉴 사진을 Gemini에 주고 음식 사진을 오버레이해 줘” 한 줄로 끝.
이건 기존 패러다임의 속도 향상이 아니다. 이전에는 불가능했던 것이 가능해진 것이다.
적용 질문: “이 앱, 신경망 한 번 호출로 그냥 되는 거 아닌가?“
3. 앞으로 “당연해 보일” 새 카테고리 (05:38)
- 카파시가 Neural-Computer(뉴럴 컴퓨터)라 부르는 개념
- 50-60년대 컴퓨터는 계산기형/신경망형 갈림길이었고 우리는 계산기 경로를 택함 → 신경망이 CPU 위에서 가상화
- 카파시의 비전: 신경망이 호스트 프로세스가 되고, CPU는 코프로세서로 격하
- 극단적으로는 원시 비디오/오디오 신호를 신경망이 받아 매 순간 UI를 디퓨전으로 렌더링
- 5-10년 안에 우리가 짜는 코드의 상당 부분이 신경망으로 흡수될 수 있다
4. AI는 채점 가능한 영역에서만 천재다 (07:24)
- RL (강화학습): 검증 보상 기반 학습
- 카파시 핵심 한 줄: “전통적 컴퓨터는 코드로 명시할 수 있는 것을 자동화한다. 이번 라운드에 LLM은 검증할 수 있는 것을 자동화한다.”
- 수학·코드는 채점 가능 → LLM이 강함 / 일상 상식은 검증 어려움 → Jagged-Intelligence
- 세차장 사례: “세차장 50m 앞인데 차로 갈까 걸어갈까?” → 모델이 “걸어가라”고 답함
- 결론: 들쭉날쭉함이 남아 있는 한 인간이 루프 안에 있어야 한다
- 체스 능력 향상도 일반 능력 진보가 아니라 데이터 분포 변화 때문
5. 파운더한테 어디에 기회가 있나 (10:13)
- 검증 가능한 RL 환경이지만 랩들이 아직 안 만든 영역에 기회
- 글쓰기처럼 애매한 영역도 LLM Judge 위원회 구조로 어느 정도 채점 가능
- “거의 모든 것은 어느 정도 검증 가능하게 만들 수 있다 — 쉬움/어려움의 차이”
6. 바이브 코딩 vs 에이전틱 엔지니어링 (11:38)
| 구분 | 정의 | 방향 |
|---|---|---|
| 바이브-코딩 | 모두를 위한 바닥을 높이기 | 코딩 못 하는 사람도 한 줄로 앱 |
| Agentic-Engineering | 천장을 확장 | 프로 품질 유지하며 더 빠르게 |
- 바이브로 만들었다고 보안 취약점을 도입해도 된다는 의미가 아니다 — 책임은 본인에게
- 옛날 “10배 엔지니어” 개념은 부족, 에이전트 잘 다루는 사람은 1000배 가능
7. 평범한 사용자 vs AI-네이티브 사용자 (13:14)
- 차이: 쓸 수 있는 도구에서 최대한을 뽑아내고, 모든 기능을 활용하고, 본인 셋업에 투자하는 것
- vim/VS Code 격차와 동일한 일이 Claude-Code/Codex/OpenClo에서 벌어지는 중
- 격차의 실체: 채팅창에 한 줄씩 vs MCP·스킬·슬래시커맨드·후크
- 에이전트 시대 채용 재설계 필요: 알고리즘 퍼즐 인터뷰는 옛 패러다임 → “트위터 클론을 안전하게 만들고, 에이전트 10개가 해킹 시도해도 뚫리지 않게” 같은 평가
8. 인간이 더 잘해야 하는 것 (15:06)
- 현재 에이전트는 인턴 수준
- 인간 영역: 미학, 판단, 시스템 모델, 스펙 설계, 감독
- 황당 사례: MenuGen에서 에이전트가 Stripe 이메일 ↔ Google 이메일을 매칭해 크레딧 배정 (유저 ID 고유성 위반, 보안 위험)
- 처방: 인간이 스펙 명세를 잡고 에이전트가 안을 채우게 한다 (Plan-Mode로는 부족, 상세 스펙 설계가 핵심)
- PyTorch/NumPy 비유: API 디테일(
keep=vskeepdims=) 암기는 인턴 에이전트 일, 시스템 모델(텐서 storage·view·broadcast) 이해는 사람 몫 - 취향 자동화는 RL의 미학 보상 어려움 때문에 아직 안 됨
9. “동물이 아니라 유령을 소환하고 있다” (18:39)
- 유령-비유: LLM은 진화의 산물(동물)이 아니라 데이터·보상으로 빚어진 통계적 시뮬레이션
- 서브스트레이트 = 프리트레이닝(다음 단어 맞추기) + RL 볼트
- 소리 지른다고 더 잘하지 않는다 — 동물 지능 직관을 그대로 적용하면 실패
- 다루는 법: “의심을 유지하면서 시간에 걸쳐 알아가는 것”
- 화자 보충: “하지 마라”는 부정 지시는 강하게 말할수록 잘 듣는 경향 (Boris도 CLAUDE.md에서 강조)
10. 에이전트 네이티브 세계 (20:31)
- 카파시 짜증 포인트: “왜 사람들은 여전히 저한테 뭘 하라고 시키죠? 저는 아무것도 하기 싫어요. 에이전트한테 복붙할 텍스트가 뭔데요?”
- 결론: 인프라·문서·API를 Agent-Native로 다시 써야 한다
- 리트머스 테스트: “menugen 빌드에서 배포해 줘” 한 줄로 Vercel 배포까지 끝나야 함
- 미래 그림: 내 에이전트가 당신 에이전트와 미팅 디테일을 잡는 시대 → 화자는 “금전거래까지 에이전트끼리”
11. Thinking은 아웃소싱 가능, Understanding은 아웃소싱 불가능 (22:35)
Thinking은 아웃소싱할 수 있다. 그러나 Understanding은 아웃소싱할 수 없다.
- Thinking(사유): 정보 처리·분석·단계 추론 → LLM이 잘함, 아웃소싱 가능
- Understanding: 정보가 자기 뇌에 들어와 모델 안에서 자리잡고 다른 정보와 연결되는 것 → 본인이 직접 해야 함
- “나는 여전히 시스템의 일부고, 정보가 내 뇌에 들어와야 한다”
- 뭘 빌드할지·왜 할 가치가 있는지·에이전트를 어떻게 지휘할지는 본인의 병목
- 처방: LLM-Wiki 같은 도구 — 기사를 위키에 쌓고 질문하면서 Understanding을 키운다
핵심 인용
이건 기존 패러다임의 속도 향상이 아니다. 이전에는 불가능했던 것이 가능해진 것이다.
10만 줄 코드 베이스를 리팩토링하고 제로데이 취약점을 찾아내는 모델이 세차장에는 차로 가야 한다는 걸 모른다.
전통적 컴퓨터는 코드로 명시할 수 있는 것을 자동화한다. 이번 라운드에 LLM은 검증할 수 있는 것을 자동화한다.
바이브 코딩은 모두를 위한 바닥을 높이는 거. 에이전틱 엔지니어링은 천장을 확장하는 거.
우리는 동물이 아니라 유령을 소환하고 있다.
왜 사람들은 여전히 저한테 뭘 하라고 시키죠? 저는 아무것도 하기 싫어요. 에이전트한테 복붙할 텍스트가 뭔데요?
Thinking은 아웃소싱할 수 있다. 그러나 Understanding은 아웃소싱할 수 없다.
현재 에이전트는 놀랍지만 인턴 수준이에요.
실행 권고 (HABITS / RECOMMENDATIONS)
- 2025년 11월 이전 경험으로 AI 코딩을 판단한 사람은 12월 이후 모델로 재시도
- 앱 만들기 전에 “신경망 한 번 호출로 그냥 되는 거 아닌가?” 자문
- 바이브로 빠르게 만들더라도 보안·검증 절차는 따른다
- 도구 셋업에 투자 — MCP·스킬·슬래시커맨드·후크
- 인간이 상위 스펙을 잡고 에이전트가 디테일을 채우는 분업
- LLM Judge/위원회로 검증 가능성을 확장
- 위키 형식으로 정보를 쌓고 질문하며 Understanding을 키운다
- LLM에 사정·협박 대신 “하지 마라”는 부정 지시를 강하게 사용
REFERENCES
- 인물: Andrej-Karpathy, Sam-Altman, 김플립
- 조직: Sequoia-Capital, OpenAI, Tesla, Anthropic
- 도구/제품: Claude-Code, Codex, MenuGen, Nano-Banana, PyTorch, NumPy, Vercel, Stripe
- 개념: Software-1-2-3-0, Jagged-Intelligence, 검증-가능성의-법칙, 바이브-코딩, Agentic-Engineering, 유령-비유, Neural-Computer, Thinking-vs-Understanding, Agent-Native
화자(김플립)의 주석 vs 카파시 원문
- 화자가 동의하는 부분: 12월 분기점, Agentic Engineering의 책임론, 10배→1000배 엔지니어
- 화자가 보충하는 부분: “하지 마라” 부정 지시의 효과 (Boris/CLAUDE.md 인용), AWS/Vercel CLI는 이미 LLM 친화적, 금전거래까지 에이전트끼리
- 화자가 이견을 보이는 부분: 미학 자동화에 대해서 — 카파시는 “랩들이 아직 안 한 것뿐”이라 보지만 화자는 “LLM 구조적 한계”라 봄
원본 자료
- 원본 자막:
00-Inbox/youtube/UNnsS03whx0.ko.vtt - 정제 텍스트:
00-Inbox/youtube/UNnsS03whx0.ko.txt - 메타데이터:
00-Inbox/youtube/UNnsS03whx0.info.json - 원본 카파시 인터뷰: Sequoia Capital 진행 (URL은 영상 설명란 참고)