Reiner Pope

Summary

Google TPU 하드웨어 팀 출신 창업자. LLM inference 인프라와 하드웨어 효율화 전문가.

Google TPU 하드웨어 팀 출신 창업자. LLM inference 인프라와 하드웨어 효율화 전문가.

알려진 정보

  • Google에서 TPU(Tensor Processing Unit) 개발 경력
  • Dwarkesh-Patel 팟캐스트에 출연, 칠판 판서 형식 강연으로 roofline analysis 설명
  • t_compute, t_memory 수식과 토큰 경제학 프레임워크를 대중에 알린 인물

주요 기여

  • LLM inference 비용을 FLOPs/bandwidth ≈ 300 상수와 sparsity로 단순화하는 분석 방법론 제시
  • 최적 배치 크기 계산법: B* ≈ 300 / sparsity
  • 20ms inference 사이클의 하드웨어적 근거 설명

관련