LLM Wiki Starter Kit — 0에서 시작하는 개인 AI 지식베이스
한 줄 설명: “Claude Code + Obsidian으로 30분 안에 LLM Wiki를 설정하고, 첫 주 안에 운영 루틴을 확립하는 가이드”
이 가이드의 목표:
- 새로운 LLM Wiki 사용자가 처음부터 끝까지 자동으로 설정할 수 있는 “최소 필수 구성(Minimum Viable Wiki)“을 제공
- 자신의 도메인에 맞게 커스터마이징하는 방법을 단계별로 안내
- 첫 달 안에 지속 가능한 운영 습관을 만드는 방법 제시
최소 구성 (Minimum Viable Wiki)
필수 폴더 구조
your-new-wiki/
├── CLAUDE.md ← 세션 프로토콜 + 핵심 규칙
├── raw/ ← Layer 1: 불변 원본
│ ├── articles/
│ ├── youtube/
│ └── pdfs/
├── wiki/ ← Layer 2: LLM 소유 구조화 지식
│ ├── sources/
│ ├── concepts/
│ ├── entities/
│ ├── insights/
│ ├── projects/
│ ├── index.md ← Layer 3: 전체 카탈로그
│ └── log.md ← 작업 이력 (필수 추적)
├── system/
│ ├── config/vault.config.yaml ← 도메인·카테고리 설정
│ └── docs/PROGRESS.md ← 온보딩 체크리스트
└── .claude/
├── settings.json ← Claude Code 하네스 설정
└── skills/ ← 작업별 절차 (setup, ingest, query, lint, ...)
필수 파일 역할
| 파일 | 역할 | 초기 내용 |
|---|---|---|
| CLAUDE.md | LLM의 세션 프로토콜 | setup_completed 상태 + 도메인·카테고리 플레이스홀더 |
| vault.config.yaml | 지식저장소 메타데이터 | setup_completed: false 상태로 시작 |
| index.md | 전체 페이지 카탈로그 | 빈 카탈로그 템플릿 (Projects, Insights, Concepts, Entities 섹션) |
| log.md | Append-only 작업 이력 | ”# 작업 이력\n\n> Append-only 작업 기록…” 헤더만 |
온보딩 5단계 (처음 설정 순서)
Step 1 — /setup 실행 (5분)
목표: 자신의 도메인·관심 주제 정의
사용자 입력:
- 지식저장소 이름: "내 두뇌"
- 도메인: "AI 기술 학습 + 블로그 운영"
- 관심 주제 5개: AI기술, 글쓰기, 커리어, 독서, 일상
결과:
vault.config.yaml자동 생성CLAUDE.md기본 규칙 자동 작성sources.yaml(추후 /curate 용) 템플릿 생성
Step 2 — 첫 소스 인제스트 (10분)
목표: 지식 추가 프로세스 체험
세 가지 방법 중 선택:
- Mode A (추천 - 시작용): 자주 보는 블로그 URL 1개 입력
/ingest → "https://simonwillison.net" 입력 → 여러 포스트 자동 수집 + `wiki/sources/` 요약 생성 - Mode B (로컬파일): 자신이 저장한 PDF/마크다운 1개
- Mode C (자연어 검색): “AI 에이전트 기술 글” 검색 → 후보 선택
결과: wiki/sources/ 에 첫 3~5개 요약 파일 생성
Step 3 — /query 첫 질의 (10분)
목표: 위키로부터 답변받기
질문 예시:
"Step 2에서 추가한 소스들에서 공통되는 핵심 아이디어는 뭐야?"
결과:
- LLM이 소스들을 읽고 통합 요약 생성
wiki/insights/에 첫 인사이트 파일 자동 저장- log.md에 자동 기록
Step 4 — /lint 첫 건강 체크 (5분)
목표: 위키 데이터 품질 확인
/lint 실행 → 6가지 체크 항목 자동 실행:
✓ Critical issues (0개) → 무시해도 됨
✓ Dangling links (0개) → 깨진 링크 없음
✓ Stale content (0개) → 오래된 것 없음
✓ Frontmatter 완성도 → 첫 파일들의 메타데이터 확인
✓ Contradiction 섹션 → 모순 없음
✓ valid_as_of 6개월 기준 → 처음엔 무관
Step 5 — /curate RSS 설정 (선택, 5~10분)
목표: 자동으로 관심 분야 소식 수집
/curate 실행 → sources.yaml에 RSS 피드 추가:
- r/MachineLearning (Reddit)
- arXiv cs.AI (학술지)
- 관심 블로거 RSS 피드
매주 자동으로 신규 소식 발굴 → /ingest 후보로 제시
총 소요 시간: 35~50분
도메인별 커스터마이징 가이드
사례 1️⃣: AI 기술 학습자 (교육자 관점)
Step 1 설정 예시:
vault:
name: "AI 학습 저장소"
domain: "Agentic AI, LLM, 생성형AI 기술 학습"
topics:
- id: agentic_ai
name: "에이전트 아키텍처"
keywords: [에이전트, Tool Use, Multi-Agent, Reflection]
- id: llm_basics
name: "LLM 기초"
keywords: [프롬프트, 토크나이저, 임베딩]
- id: teaching
name: "교육 방법론"
keywords: [강의설계, 실습, 평가]Step 2 소스 추천:
- Simon Willison의 블로그 (agentic-ai, llm-basics)
- Karpathy의 유튜브 강의 (llm-basics)
- HuggingFace 공식 블로그 (llm-basics)
- 자신의 강의 자료 PDF (teaching)
첫 달 목표:
- 20~30개 sources 수집
- 3~5개 concepts 문서 작성 (개념 정의)
- 2~3개 insights 문서 작성 (3개 이상 소스 통합)
사례 2️⃣: DAP 운영 엔지니어 (실무자 관점)
Step 1 설정 예시:
vault:
name: "DAP 운영 나노지식베이스"
domain: "Airflow, Redshift, DataStage 실무 노하우"
topics:
- id: dap_ops
name: "DAP 운영"
keywords: [Airflow DAG, Redshift, 멱등성]
- id: incident_response
name: "장애 대응"
keywords: [RCA, Runbook, 자동화]Step 2 소스 추천:
- 회사 내부 Runbook (자신이 작성한 것)
- Astronomer 공식 DAG 모범 사례
- 자신의 장애 대응 기록 (PM 노트)
첫 달 목표:
- 10~15개 sources (실제 장애 케이스)
- 3~5개 concepts (DAG 설계 패턴, 멱등성 등)
- 1~2개 insights (장애 분석 종합)
- 1~2개 projects (현재 진행 중인 개선 항목)
사례 3️⃣: 일반 지식 관리 (개인용)
Step 1 설정 예시:
vault:
name: "개인 두뇌"
domain: "자기계발, 일상, 일 노하우"
topics:
- id: career
name: "커리어"
keywords: [기술, 리더십, 면접]
- id: life
name: "일상"
keywords: [운동, 독서, 여행]Step 2 소스 추천:
- 자주 읽는 뉴스레터 (Substack)
- 개인 블로그 아카이브
- 책 요약 노트
첫 달 목표:
- 15~25개 sources
- 2~3개 concepts
- 1개 insights (자신의 일주일 배움 종합)
핵심 운영 규칙 (반드시 기억할 5가지)
1️⃣ raw/ 폴더는 건드리지 말 것
❌ raw/ 파일 수정 절대 금지 → 원본 무결성 보존
✅ raw/ 파일 추가는 O (새로운 원본 인제스트)
2️⃣ log.md를 먼저 쓰고 wiki/ 편집
모든 wiki/ 수정 전:
1. log.md 열기
2. "## [2026-04-27] ingest | 새 소스 추가" 엔트리 추가
3. 그 다음 wiki/ 파일 편집
3️⃣ 3개 이상 소스를 합치면 insights/로
✅ 소스 1개 → wiki/sources/[소스].md (요약만)
✅ 소스 2개 → wiki/concepts/[개념].md (개념 정의)
✅ 소스 3개+ → wiki/insights/[주제]-[날짜].md (통합 분석)
4️⃣ Frontmatter 6개 필드 필수
tags: [array]
created: YYYY-MM-DD
updated: YYYY-MM-DD
valid_as_of: YYYY-MM-DD # 수치/통계/정책 정보는 필수
sources: [링크 배열]
source_count: N5️⃣ valid_as_of가 6개월 이상 경과하면 lint 플래그
2026-04-27 파일 생성
↓ (6개월 경과)
2026-10-27 이후 /lint 실행
→ ⚠️ "valid_as_of 만료" 플래그 표시
→ 파일 내용 검수 후 업데이트
🔨 온보딩 체크리스트
초기 설정 (첫 30분)
-
/setup실행 → 도메인·카테고리 정의 -
vault.config.yaml생성 확인 →setup_completed: false상태 -
raw/3개 폴더 생성 (articles, youtube, pdfs) -
wiki/6개 폴더 생성 (sources, concepts, entities, insights, projects, views) -
system/config/,system/docs/폴더 생성 -
.claude/skills/폴더 구조 확인 (선택 - 기존 skills 복사 가능)
첫 주 운영 (매일 5~10분)
- Day 1: 첫 소스 3~5개 인제스트 (
/ingest) - Day 2~3:
/query첫 질의 → 인사이트 생성 - Day 4:
/lint첫 건강 체크 - Day 5: 개념 페이지 1개 작성 (여러 소스의 공통점)
- Day 7:
/curateRSS 설정 또는 주간 루틴 계획
첫 달 이후 (주 1~2회)
- 매주 금요일:
/lint건강 체크 (5분) - 매주:
log.md최근 항목 3~5개 확인 (진도 파악) - 월 2회: 새 소스 5~10개 인제스트
📚 참고 개념
- llm-wiki — LLM Wiki의 핵심 패러다임 설명
- three-layer-architecture — Layer 1/2/3 상세 구조
- phase9-pkm-improvement — 실제 운영 사례 (이 vault)
🎓 추천 학습 순서
처음 1주일: Step 13 완료 (온보딩 끝)
1~4주차: Step 45 + 도메인별 첫 sources 20개 수집
1개월 후: 자신의 concepts 파일 2~3개 직접 작성 → insights 첫 시도
3개월 후 목표:
sources: 30~50개 (도메인 핵심 자료)
concepts: 5~10개 (개념 정의 문서)
insights: 3~5개 (통합 분석)
projects: 1~2개 (현재 진행 중인 일/학습)
progress: ⭐⭐⭐⭐ (자신의 지식이 눈에 보임)
시작하기: 지금 바로 /setup 명령어를 실행하세요! 🚀