Nano Banana
Summary
Google Gemini 계열의 이미지 생성/편집 모델 (코드네임 “Nano Banana”로 알려진 멀티모달 이미지 모델).
Google Gemini 계열의 이미지 생성/편집 모델 (코드네임 “Nano Banana”로 알려진 멀티모달 이미지 모델).
능력
- 입력 이미지의 픽셀 위에 직접 새 이미지를 그려서 반환
- 텍스트 한 줄로 이미지 편집·오버레이 지시 가능
- 별도 OCR/생성 파이프라인 없이 end-to-end
Andrej-Karpathy 인용 사례
MenuGen을 통째로 불필요하게 만든 모델:
메뉴 사진을 Gemini에 주고 “메뉴 위에 음식 사진을 오버레이해 줘” 한 줄.
→ 코드/백엔드/배포가 사라지는 소프트웨어 3.0 충격의 실증.
의의
- Neural-Computer 비전의 단편 — “코드가 사라진 자리에 신경망이 직접 들어간다”
- “입력 이미지가 신경망을 통과해서 출력 이미지가 나온다. 중간에 코드가 끼어들 자리가 없다”
관련 항목
- Google / Gemini
- MenuGen
- Software-1-2-3-0
- Neural-Computer
출처
- yt-UNnsS03whx0-카파시-30분-인터뷰-완전정리 (Section 2)