Reiner Pope
Summary
Google TPU 하드웨어 팀 출신 창업자. LLM inference 인프라와 하드웨어 효율화 전문가.
Google TPU 하드웨어 팀 출신 창업자. LLM inference 인프라와 하드웨어 효율화 전문가.
알려진 정보
- Google에서 TPU(Tensor Processing Unit) 개발 경력
- Dwarkesh-Patel 팟캐스트에 출연, 칠판 판서 형식 강연으로 roofline analysis 설명
t_compute,t_memory수식과 토큰 경제학 프레임워크를 대중에 알린 인물
주요 기여
- LLM inference 비용을
FLOPs/bandwidth ≈ 300상수와 sparsity로 단순화하는 분석 방법론 제시 - 최적 배치 크기 계산법:
B* ≈ 300 / sparsity - 20ms inference 사이클의 하드웨어적 근거 설명