Nano Banana

Summary

Google Gemini 계열의 이미지 생성/편집 모델 (코드네임 “Nano Banana”로 알려진 멀티모달 이미지 모델).

Google Gemini 계열의 이미지 생성/편집 모델 (코드네임 “Nano Banana”로 알려진 멀티모달 이미지 모델).

능력

  • 입력 이미지의 픽셀 위에 직접 새 이미지를 그려서 반환
  • 텍스트 한 줄로 이미지 편집·오버레이 지시 가능
  • 별도 OCR/생성 파이프라인 없이 end-to-end

Andrej-Karpathy 인용 사례

MenuGen을 통째로 불필요하게 만든 모델:

메뉴 사진을 Gemini에 주고 “메뉴 위에 음식 사진을 오버레이해 줘” 한 줄.

→ 코드/백엔드/배포가 사라지는 소프트웨어 3.0 충격의 실증.

의의

  • Neural-Computer 비전의 단편 — “코드가 사라진 자리에 신경망이 직접 들어간다”
  • “입력 이미지가 신경망을 통과해서 출력 이미지가 나온다. 중간에 코드가 끼어들 자리가 없다”

관련 항목

출처