토큰값 0원! 구글 Gemma 4로 나만의 AI 코딩 에이전트 육성하기 EP.2
Source: 2026-04-09-connect-ai-lab-gemma4-agent-ep2 Type: YouTube By: CONNECT AI LAB Valid as of: 2026-04-09 Duration: 24:03
핵심 Takeaway
- 안티그래비티(Anti-Gravity) 바이브 코딩 툴에 로컬 Gemma 4를 연결하는 방법을 시연하며, 토큰 소진 없이 코드를 생성·수정한다.
- 비용 최적화 전략: “로컬 Gemma 4로 초기 코드 생성 → 고급 클라우드 AI(Claude/Gemini)로 업그레이드” 순서가 토큰 사용량을 크게 줄인다.
antigraviconfig.json의temperature파라미터를 0.1로 설정하면 코딩 에이전트의 창의성 과잉을 제어할 수 있다.- Gemma 4 vs Gemini 3.1 Pro vs Claude Opus 웹사이트 생성 비교: 기본 기능 구현은 Gemma 4로 가능, 고품질 디자인은 클라우드 AI 활용.
- AI 1인 기업의 핵심 원칙: “꼭 필요한 작업에만 클라우드 AI, 반복·간단 작업은 로컬 AI” — 비용 체적화(Cost Optimization).
상세 요약
안티그래비티 + Ollama 연결 구조
에이전트 기반 바이브 코딩 툴인 안티그래비티(Anti-Gravity)는 내장 AI 모델(Gemini, Claude, GPT) 사용 시 토큰이 소비된다. ollama를 서버로 실행하고, 안티그래비티 설정 파일(antigraviconfig.json)을 통해 로컬 gemma-4로 연결하면 토큰 소진 없이 코딩이 가능하다.
토큰 소비 구조: 명령 입력 시 + AI 응답 생성 시 모두 토큰 소비. 로컬 모델은 이 두 단계 모두 내 컴퓨터에서 처리.
antigraviconfig.json 설정
{
"model": "gemma4:4b",
"temperature": 0.1
}model: 사용할 Ollama 모델 이름 (2B 사용 시gemma4:2b)temperature: 0에 가까울수록 일관된 결과, 1에 가까울수록 창의적. 코딩 에이전트에는 0.1 권장- 안티그래비티에서
@LOCAL커맨드로 로컬 모델로 전환
웹사이트 개발 3종 비교 (2026-04-09 기준)
| 모델 | 결과 | 특징 |
|---|---|---|
| gemma-4 (로컬) | 기본 미래지향 웹사이트 + 애니메이션 | 무료, 오프라인, 기능 구현 가능 |
| Gemini 3.1 Pro | 화려한 애니메이션, 세련된 디자인 | 토큰 소비, 클라우드 |
| Claude Opus | ”Welcome to the Construct” 컨셉 | 토큰 소비, 클라우드 |
비용 최적화 전략 (Cost Optimization)
AI 1인 기업 운영의 핵심 원칙 3단계:
- 초기 코드 생성: 로컬 Gemma 4로 베이스 코드 생성 (토큰 0)
- 업그레이드: Gemini/Claude로 디자인·기능 고도화 (토큰 최소 소비)
- 세부 수정: 색상 변경, 숫자 수정 등 디테일은 다시 로컬 Gemma 4 (토큰 0)
“AI 1인 기업도 항상 Claude를 사용할 필요 없고 항상 Gemini 3.1 Pro를 사용할 필요가 없습니다.” (출처: 2026-04-09 영상)
이 전략은 vibe-coding의 비용 측면을 구체화한 실전 워크플로우다.
연결되는 위키 페이지
- gemma-4 — 이 영상의 주요 로컬 AI 엔진
- ollama — 안티그래비티와의 연결 매개체
- vibe-coding — 비용 최적화 관점의 바이브 코딩 전략 (이 소스로 강화)
- yt-connect-ai-lab-gemma4-agent-ep1-2026 — 동일 시리즈 EP.1: Gemma 4 설치
- yt-connect-ai-lab-connect-ai-v2-plugin-2026 — 동일 시리즈 Special: Connect AI V2 플러그인
- yt-connect-ai-lab-gemma4-second-brain-2026 — 동일 시리즈 EP.3: 제2의 두뇌