LLM Wiki — 개인 지식관리소의 새로운 패러다임
정의: LLM Wiki는 개인(또는 조직)의 산재된 소스를 한 번 통합하고 구조화된 지식 베이스로 컴파일하여, 이후 쿼리는 이미 누적된 위키를 탐색하는 방식의 지식관리 시스템입니다. RAG와 다르게, 합성은 인제스트 시점에 완료되고 지식이 세션을 넘어 영속화됩니다.
설명
핵심 개념
LLM Wiki는 다음 세 가지 원칙을 기반으로 합니다:
1. 인제스트 시 합성 (Synthesis at Ingest)
- RAG: 쿼리 → 원본 청크 재검색 → 즉흥 합성 (매번 재계산)
- LLM Wiki: 소스 추가 → LLM 1회 통합 → 위키에 파일링 → 이후 쿼리는 이미 합성된 위키 탐색
결과: 동일 주제 재쿼리 시 비용 감소, 답변 깊이 증가 (Compounding 효과).
2. 인덱스 우선 탐색 (Index-First Retrieval)
- 벡터 DB 대신 인간이 읽을 수 있는 카탈로그 (
index.md) 사용 - Grep 기반 전문 검색 + LLM의 컨텍스트 윈도우 활용
- ~100 소스까지 단순 파일 구조로 충분
결과: 벡터 인프라 불필요, 문맥 풍부, 투명성 높음.
3. 지식의 영속화 (Knowledge Persistence)
- RAG: 세션 종료 시 모든 합성 결과 폐기
- LLM Wiki: 위키 파일 자체가 영구적 자산
- 시간 경과에 따라 지식이 누적, 깊이가 증가
LLM Wiki vs RAG 비교
| 차원 | RAG | LLM Wiki |
|---|---|---|
| 합성 시점 | 쿼리 시 즉흥 | 인제스트 시 사전 컴파일 |
| 교차참조 | 없음 (청크 단위 고립) | 풍부한 위키 그래프 |
| 모순 처리 | 없음 (충돌 정보 혼재) | 플래그 + Contradiction 섹션 |
| 인프라 | 벡터 DB + 임베딩 모델 | 파일 구조 + Grep |
| 지식 영속성 | 세션 종료 시 폐기 | 위키가 세션을 넘어 유지 |
| 비용 (재쿼리) | 매번 동일 | 감소 (누적된 위키 활용) |
| 소유권 | LLM이 매번 원본 읽음 | LLM이 Layer 2(Wiki) 소유·유지 |
3계층 아키텍처 (Three-Layer Architecture)
LLM Wiki는 세 계층으로 구성됩니다:
Layer 1: Raw Sources (불변 원본)
- YouTube 영상, 블로그, PDF, 논문
- 원본 변경 금지 (데이터 무결성)
- 예:
raw/articles/,raw/youtube/,raw/pdfs/
Layer 2: Wiki (구조화된 지식)
- 소스 요약 + 개념화 + 통합
- LLM이 유지·갱신
- 예:
wiki/sources/,wiki/concepts/,wiki/insights/
Layer 3: Index & Navigation (탐색 인터페이스)
index.md: 전체 카탈로그 (벡터 DB 역할)- Grep 기반 검색 + 인간이 읽을 수 있는 정렬
- Dataview 기반 자동 대시보드
LLM Wiki가 적합한 상황
1. 개인·소규모 도메인 지식
- ~100 소스 규모
- 벡터 인프라 없이 운영 가능
- 예: 개인 학습, 팀 나올리지 베이스
2. 시간 경과에 따른 지식 누적
- 연구, 교육, 커리어 성장 문맥
- 소스가 지속 추가되는 환경
- 예: 강의 자료, 연구 노트, 커리어 포트폴리오
3. 교차참조·맥락 연결이 핵심
- 분산된 소스 간 아이디어 연결
- 패턴 인식, 통합 분석
- 예: 정책 영향도 분석, 기술 비교
4. 모순 감지·일관성 유지
- 다중 소스 통합 시 충돌 해결 필요
- Lint 메커니즘으로 데이터 품질 유지
- 예: 정책·기술 표준화
구현 예: Phase 9 PKM 시스템
phase9-pkm-improvement는 LLM Wiki 원칙을 실현하는 프로젝트입니다:
- Layer 1 정비:
raw/파일 명확화 (Inbox SOP) - Layer 2 개선: Frontmatter 표준화, Index.md 자동화, Dashboard 구축
- Layer 3 강화: Dependency Tree, FAQ, Learning Paths
🔨 행동 체크리스트
LLM Wiki 신규 볼트 설정 시 (초기화)
- 폴더 구조 생성:
raw/(articles, youtube, pdfs),wiki/(sources, concepts, entities, insights) - index.md 초기화: 전체 카탈로그 구조 설계 및 각 섹션 템플릿 작성
- log.md 생성: “Append-only 작업 이력” 문구 포함 (수정 금지 규칙 명시)
- /setup 실행: 도메인, 관심 주제(topics) 설정 완료
- Frontmatter 표준화: 모든 wiki 파일에 동일한 메타데이터 스키마 적용 (tags, created, updated, sources, source_count)
- 첫 소스 인제스트: 간단한 아티클 1개를 직접 인제스트하여 workflow 검증
주간·월간 LLM Wiki 운영 점검
- 새 소스 처리: 미처리 inbox 파일 → raw/ → wiki/ 파이프라인 실행
- log.md 최근 항목 확인: 지난주 작업이 제대로 기록되었는가?
- index.md 누락 페이지 검사: 신규 생성 파일이 인덱스에 등록되었는가?
- 모순(Contradiction) 섹션 점검: 소스 간 상충하는 정보가 있는가?
- Frontmatter 완성도: valid_as_of 날짜가 6개월 이상 경과한 파일이 있는가? (린트 필요)
- 위키 건강도 린트: 기본 린트 알고리즘 실행 (broken links, stale content 등)
💡 교육자·PM 활용: 학생이나 팀원의 LLM Wiki 설정을 도울 때, 신규 설정 체크리스트를 따르고, 이후 운영 점검 체크리스트로 정기적 유지보수 습관을 들이게 하세요.
구현 사례
- 알다(Alda) — 배움의달인-김문정이 직접 개발한 Obsidian 커뮤니티 플러그인. MLX 기반 완전 로컬 운영. 1,228개 노트 인덱싱, 새벽 자동 배치, MCP로 Claude Code 연동.
참고 개념
- three-layer-architecture — 3계층 상세 아키텍처
- index-first-retrieval — 벡터 DB 없는 탐색
- compounding-artifact — 지식 누적 효과
- llm-wiki-vs-rag-comparison-2026-04-20 — RAG와 상세 비교
- yt-YCirjfAurng-LLM-Wiki-활용법-알다-로컬LLM — 로컬 LLM 기반 LLM Wiki 실전 운영 사례
- yt-dVMu7vcej14-헤르메스-에이전트-리뷰-670스킬-LLM위키-텔레그램봇 — Hermes + KepaSEE LLM Wiki 연동 실습 (일하는 ai)