꼭 알아야할 안드레 카파시 30분 인터뷰 완전정리 - AI시대의 필수 인사이트!

Andrej-KarpathySequoia-Capital에서 진행한 30분 인터뷰를 김플립-LLM-코딩 채널이 11개 섹션으로 정리·해설한 영상. 발행일 2026-05-05, 22,230회 조회.

TL;DR

11개 섹션 요약

1. 2025년 12월이 분기점이었다 (00:41)

  • 카파시는 1년 가까이 Claude-Code 같은 에이전트를 써왔지만, 그 1년 동안의 경험은 “코드 덩어리를 던져 주면 가끔 맞고 가끔 직접 고쳐야 하는” 수준
  • 12월에 휴가가 생겨 최신 모델로 다시 돌려봤더니 “그냥 코드가 나오는” 경험 — 시스템을 신뢰하기 시작
  • 핵심 메시지: “작년에 ChatGPT 정도 수준에서 AI를 경험했다면 12월부터는 다시 봐야 한다”
  • AI 발전은 곡선이 아니라 계단형 분기점으로 끊어진다

2. Software 1.0 → 2.0 → 3.0 (02:58)

단계방식
1.0직접 코드 작성
2.0신경망 훈련 (데이터셋·아키텍처 설계)
3.0프롬프트 작성 = 프로그래밍, 컨텍스트 윈도우가 레버

OpenClo 설치 사례: 옛날 같으면 OS별 bash 스크립트 분기 처리 필요 → 지금은 텍스트 한 덩어리를 에이전트에 붙여 넣으면 끝.

MenuGen 사례 (충격적): 카파시 본인 사이드 프로젝트(메뉴 사진 → OCR → 이미지 생성)가 Nano-Banana의 등장으로 통째로 불필요해짐. “메뉴 사진을 Gemini에 주고 음식 사진을 오버레이해 줘” 한 줄로 끝.

이건 기존 패러다임의 속도 향상이 아니다. 이전에는 불가능했던 것이 가능해진 것이다.

적용 질문: “이 앱, 신경망 한 번 호출로 그냥 되는 거 아닌가?“

3. 앞으로 “당연해 보일” 새 카테고리 (05:38)

  • 카파시가 Neural-Computer(뉴럴 컴퓨터)라 부르는 개념
  • 50-60년대 컴퓨터는 계산기형/신경망형 갈림길이었고 우리는 계산기 경로를 택함 → 신경망이 CPU 위에서 가상화
  • 카파시의 비전: 신경망이 호스트 프로세스가 되고, CPU는 코프로세서로 격하
  • 극단적으로는 원시 비디오/오디오 신호를 신경망이 받아 매 순간 UI를 디퓨전으로 렌더링
  • 5-10년 안에 우리가 짜는 코드의 상당 부분이 신경망으로 흡수될 수 있다

4. AI는 채점 가능한 영역에서만 천재다 (07:24)

  • RL (강화학습): 검증 보상 기반 학습
  • 카파시 핵심 한 줄: “전통적 컴퓨터는 코드로 명시할 수 있는 것을 자동화한다. 이번 라운드에 LLM은 검증할 수 있는 것을 자동화한다.”
  • 수학·코드는 채점 가능 → LLM이 강함 / 일상 상식은 검증 어려움 → Jagged-Intelligence
  • 세차장 사례: “세차장 50m 앞인데 차로 갈까 걸어갈까?” → 모델이 “걸어가라”고 답함
  • 결론: 들쭉날쭉함이 남아 있는 한 인간이 루프 안에 있어야 한다
  • 체스 능력 향상도 일반 능력 진보가 아니라 데이터 분포 변화 때문

5. 파운더한테 어디에 기회가 있나 (10:13)

  • 검증 가능한 RL 환경이지만 랩들이 아직 안 만든 영역에 기회
  • 글쓰기처럼 애매한 영역도 LLM Judge 위원회 구조로 어느 정도 채점 가능
  • “거의 모든 것은 어느 정도 검증 가능하게 만들 수 있다 — 쉬움/어려움의 차이”

6. 바이브 코딩 vs 에이전틱 엔지니어링 (11:38)

구분정의방향
바이브-코딩모두를 위한 바닥을 높이기코딩 못 하는 사람도 한 줄로 앱
Agentic-Engineering천장을 확장프로 품질 유지하며 더 빠르게
  • 바이브로 만들었다고 보안 취약점을 도입해도 된다는 의미가 아니다 — 책임은 본인에게
  • 옛날 “10배 엔지니어” 개념은 부족, 에이전트 잘 다루는 사람은 1000배 가능

7. 평범한 사용자 vs AI-네이티브 사용자 (13:14)

  • 차이: 쓸 수 있는 도구에서 최대한을 뽑아내고, 모든 기능을 활용하고, 본인 셋업에 투자하는 것
  • vim/VS Code 격차와 동일한 일이 Claude-Code/Codex/OpenClo에서 벌어지는 중
  • 격차의 실체: 채팅창에 한 줄씩 vs MCP·스킬·슬래시커맨드·후크
  • 에이전트 시대 채용 재설계 필요: 알고리즘 퍼즐 인터뷰는 옛 패러다임 → “트위터 클론을 안전하게 만들고, 에이전트 10개가 해킹 시도해도 뚫리지 않게” 같은 평가

8. 인간이 더 잘해야 하는 것 (15:06)

  • 현재 에이전트는 인턴 수준
  • 인간 영역: 미학, 판단, 시스템 모델, 스펙 설계, 감독
  • 황당 사례: MenuGen에서 에이전트가 Stripe 이메일 ↔ Google 이메일을 매칭해 크레딧 배정 (유저 ID 고유성 위반, 보안 위험)
  • 처방: 인간이 스펙 명세를 잡고 에이전트가 안을 채우게 한다 (Plan-Mode로는 부족, 상세 스펙 설계가 핵심)
  • PyTorch/NumPy 비유: API 디테일(keep= vs keepdims=) 암기는 인턴 에이전트 일, 시스템 모델(텐서 storage·view·broadcast) 이해는 사람 몫
  • 취향 자동화는 RL의 미학 보상 어려움 때문에 아직 안 됨

9. “동물이 아니라 유령을 소환하고 있다” (18:39)

  • 유령-비유: LLM은 진화의 산물(동물)이 아니라 데이터·보상으로 빚어진 통계적 시뮬레이션
  • 서브스트레이트 = 프리트레이닝(다음 단어 맞추기) + RL 볼트
  • 소리 지른다고 더 잘하지 않는다 — 동물 지능 직관을 그대로 적용하면 실패
  • 다루는 법: “의심을 유지하면서 시간에 걸쳐 알아가는 것”
  • 화자 보충: “하지 마라”는 부정 지시는 강하게 말할수록 잘 듣는 경향 (Boris도 CLAUDE.md에서 강조)

10. 에이전트 네이티브 세계 (20:31)

  • 카파시 짜증 포인트: “왜 사람들은 여전히 저한테 뭘 하라고 시키죠? 저는 아무것도 하기 싫어요. 에이전트한테 복붙할 텍스트가 뭔데요?”
  • 결론: 인프라·문서·API를 Agent-Native로 다시 써야 한다
  • 리트머스 테스트: “menugen 빌드에서 배포해 줘” 한 줄로 Vercel 배포까지 끝나야 함
  • 미래 그림: 내 에이전트가 당신 에이전트와 미팅 디테일을 잡는 시대 → 화자는 “금전거래까지 에이전트끼리”

11. Thinking은 아웃소싱 가능, Understanding은 아웃소싱 불가능 (22:35)

Thinking은 아웃소싱할 수 있다. 그러나 Understanding은 아웃소싱할 수 없다.

  • Thinking(사유): 정보 처리·분석·단계 추론 → LLM이 잘함, 아웃소싱 가능
  • Understanding: 정보가 자기 뇌에 들어와 모델 안에서 자리잡고 다른 정보와 연결되는 것 → 본인이 직접 해야 함
  • “나는 여전히 시스템의 일부고, 정보가 내 뇌에 들어와야 한다”
  • 뭘 빌드할지·왜 할 가치가 있는지·에이전트를 어떻게 지휘할지는 본인의 병목
  • 처방: LLM-Wiki 같은 도구 — 기사를 위키에 쌓고 질문하면서 Understanding을 키운다

핵심 인용

이건 기존 패러다임의 속도 향상이 아니다. 이전에는 불가능했던 것이 가능해진 것이다.

10만 줄 코드 베이스를 리팩토링하고 제로데이 취약점을 찾아내는 모델이 세차장에는 차로 가야 한다는 걸 모른다.

전통적 컴퓨터는 코드로 명시할 수 있는 것을 자동화한다. 이번 라운드에 LLM은 검증할 수 있는 것을 자동화한다.

바이브 코딩은 모두를 위한 바닥을 높이는 거. 에이전틱 엔지니어링은 천장을 확장하는 거.

우리는 동물이 아니라 유령을 소환하고 있다.

왜 사람들은 여전히 저한테 뭘 하라고 시키죠? 저는 아무것도 하기 싫어요. 에이전트한테 복붙할 텍스트가 뭔데요?

Thinking은 아웃소싱할 수 있다. 그러나 Understanding은 아웃소싱할 수 없다.

현재 에이전트는 놀랍지만 인턴 수준이에요.

실행 권고 (HABITS / RECOMMENDATIONS)

  1. 2025년 11월 이전 경험으로 AI 코딩을 판단한 사람은 12월 이후 모델로 재시도
  2. 앱 만들기 전에 “신경망 한 번 호출로 그냥 되는 거 아닌가?” 자문
  3. 바이브로 빠르게 만들더라도 보안·검증 절차는 따른다
  4. 도구 셋업에 투자 — MCP·스킬·슬래시커맨드·후크
  5. 인간이 상위 스펙을 잡고 에이전트가 디테일을 채우는 분업
  6. LLM Judge/위원회로 검증 가능성을 확장
  7. 위키 형식으로 정보를 쌓고 질문하며 Understanding을 키운다
  8. LLM에 사정·협박 대신 “하지 마라”는 부정 지시를 강하게 사용

REFERENCES

화자(김플립)의 주석 vs 카파시 원문

  • 화자가 동의하는 부분: 12월 분기점, Agentic Engineering의 책임론, 10배→1000배 엔지니어
  • 화자가 보충하는 부분: “하지 마라” 부정 지시의 효과 (Boris/CLAUDE.md 인용), AWS/Vercel CLI는 이미 LLM 친화적, 금전거래까지 에이전트끼리
  • 화자가 이견을 보이는 부분: 미학 자동화에 대해서 — 카파시는 “랩들이 아직 안 한 것뿐”이라 보지만 화자는 “LLM 구조적 한계”라 봄

원본 자료

  • 원본 자막: 00-Inbox/youtube/UNnsS03whx0.ko.vtt
  • 정제 텍스트: 00-Inbox/youtube/UNnsS03whx0.ko.txt
  • 메타데이터: 00-Inbox/youtube/UNnsS03whx0.info.json
  • 원본 카파시 인터뷰: Sequoia Capital 진행 (URL은 영상 설명란 참고)