안드레이 카파시도 주목할! LLM Wiki 활용법 (Local LLM 활용 공개)

채널: 배움의 달인 (AI·자동화) | 2026-05-06 | 22분

요약

9,700개 Obsidian 노트 중 1,228개를 로컬 LLM으로 인덱싱해 만든 개인 LLM 위키 “알다(Alda)“의 구축 사례와 활용법 공개. 인덱싱·질문·리포트 생성까지 전 과정을 로컬 LLM(MLX)으로 운영하며, Claude Code/Codex의 MCP로 연결해 대규모 리포트 생성에 활용한다. 단순 구축이 아니라 어떻게 쓸 것인가에 방점을 둔 실전 워크플로우.


IDEAS

  1. LLM Wiki의 핵심 가치는 구축이 아니라 활용 방식을 설계하는 것
  2. 노트의 원본 퀄리티(인사이트 밀도)가 LLM Wiki 성능을 결정한다
  3. 로컬 LLM으로 전 과정을 운영하면 민감 정보를 클라우드 유출 없이 처리 가능
  4. 질문 대화 결과를 자동 저장 → 재인덱싱 → 위키 팩트 자동 업데이트 피드백 루프
  5. 웹서치 기능으로 2년 전 노트의 stale 정보를 실시간 검증·보완
  6. Obsidian 플러그인(“알다”)을 직접 제작해 RAG + 그래프 뷰 통합
  7. MLX 기반 로컬 LLM: 올라마보다 속도 우수, 전력·발열 고려해 새벽 인덱싱 스케줄
  8. BGE-M3 임베딩 + NVIDIA NeMo Nemotron + QM 추론 모델 3종 조합으로 71GB RAM 소요
  9. 로컬 LLM의 컨텍스트 창은 Claude 100만 토큰의 약 1/100 수준 — 복잡한 작업엔 한계
  10. 복잡한 리포트 생성은 Claude Code/Codex + MCP 연동으로 보완
  11. CLAUDE.md에 긴 프로세스를 넣으면 토큰 낭비 → 스킬(Skill)로 분리하는 것이 효율적
  12. 슬래시 커맨드가 아닌 스킬로 작업 흐름을 정의해야 컨텍스트 오염 방지
  13. 개인 정보(학생 상담 기록 등)는 인덱싱 폴더에서 격리 — 비공개 폴더 운영
  14. 자동 인덱싱 스케줄(새벽 1시 시작, 5시 종료)로 주간 활동과 충돌 방지
  15. 알다 대화 폴더가 인덱싱 대상에 포함되어 대화 자체가 위키 소스로 누적
  16. 전체 볼트가 아닌 선별된 폴더만 인덱싱 → 노이즈 감소, 정밀도 향상
  17. LLM Wiki는 개인화된 해석이 핵심 — 단일 정답 없음
  18. AI 리포트 생성 스킬: 웹서치 + RAG + Obsidian 소스 + 개념 지도 자동 생성
  19. 엔티티(사람·조직)와 컨셉을 구분해 그래프로 관리하면 위키피디아식 탐색 가능
  20. 로컬 LLM 사양 요건: 128GB 통합 메모리 Mac, 71GB RAM 소요

INSIGHTS

  1. 피드백 루프가 LLM Wiki를 살아있는 시스템으로 만든다. 질문 → 대화 저장 → 재인덱싱 → 팩트 업데이트가 자동화되면, 위키는 사용할수록 더 정확해지는 복리 구조를 가진다.
  2. 로컬 LLM과 클라우드 LLM은 경쟁이 아니라 역할 분담이다. 로컬은 프라이버시·비용·상시 인덱싱에, 클라우드(Claude Code)는 긴 컨텍스트·고품질 추론 작업에 최적화해 보완적으로 쓰는 것이 실용적 전략이다.
  3. LLM Wiki의 ROI는 입력 노트 품질에 비례한다. 구축 기술보다 어떤 인사이트를 기록해왔는가가 결과 품질의 천장을 결정한다.
  4. 워크플로우의 복잡도는 스킬로 흡수해야 한다. 슬래시 커맨드(CLAUDE.md)에 절차를 넣으면 토큰 낭비와 컨텍스트 오염이 발생하므로, 재사용 로직은 반드시 스킬 파일로 분리해야 한다.
  5. 개인 LLM Wiki의 진정한 가치는 자신의 사고방식이 반영된 질의응답 시스템이다. 단순 문서 검색이 아니라, 본인이 큐레이션한 지식 위에서 작동하는 개인화 AI라는 점이 차별점이다.

QUOTES

  • “LLM 위키를 구축한다라는 그 자체 행위보다 어, 어떠한 노트, 어, 얼만큼 좋은 고퀄리티의 노트, 인사이트가 담긴 노트를 바탕으로 해서 LLM 위키를 구축했냐라는게 더 중요한 핵심인 거 같아요.”
  • “슬래시 커맨드로 만들게 되면 이게 다 클로드 md 파일로 들어가게 돼서 그 토큰값을 엄청 잡아먹게 돼요. 그래서 각 과정 한해싱 한 것들을 스킬로 만드는 것을 전 추천을 드립니다.”
  • “인덱싱 모든 과정들이 로컬 LLM으로 되고 있다. 제 LLM키에 사용되는 모든 것은 클라우드로 유출되지 않고 오롯이 제 맥북 안에서만 운영이 된다.”
  • “단순히 LLM 위키 구축 그 자체만을 생각하는 게 아니라 구축해서 어떻게 사용할 것인가에 대한 저 나름의 해석이 들어가 있는 부분입니다.”
  • “로컬 LLM 같은 경우에는 약 토큰값이 컨텍스트 토큰값이 지금 클로드 같은 경우에는 100만 토큰인데 그거에 한 1/100 수준밖에 안 되기 때문에 텍스트의 양이 충분하지 않고 조금 아쉬운 부분들이 있어요.”

REFERENCES

FACTS

  • 채널 운영자 Obsidian 노트 총 9,700개, 그중 1,228개 인덱싱
  • 로컬 LLM 3종 동시 운영 시 약 71GB RAM 소요 (128GB 통합 메모리 Mac 사용)
  • Claude의 컨텍스트 창: 100만 토큰 / 로컬 LLM은 약 1만 토큰 (약 1/100)
  • 알다 플러그인 통계: 엔티티 908개, 컨셉 429개, 커넥션 10,000+건
  • 인덱싱 스케줄: 새벽 1시 로컬 LLM 자동 시작 → 새벽 5시 종료
  • 영상 공개일: 2026-05-06

HABITS

  • 낮에 생성된 노트를 새벽 2시 자동 인덱싱 배치로 처리 → 아침에 결과 확인
  • 질문 대화를 자동 저장 폴더에 보관해 위키 소스로 재활용
  • 개인 정보(학생 상담)는 인덱싱 폴더에서 제외, 별도 비공개 폴더로 격리
  • 복잡한 작업은 로컬 LLM이 아닌 Claude Code + MCP로 위임

RECOMMENDATIONS

  • LLM Wiki 구축 전에 노트 품질을 먼저 점검할 것 — 인사이트가 없는 노트는 좋은 RAG 결과를 내지 못한다
  • 긴 작업 절차는 CLAUDE.md 슬래시 커맨드 대신 Skills 파일로 분리해 토큰 절약
  • 전체 볼트 인덱싱보다 핵심 폴더만 선별 인덱싱으로 노이즈를 줄일 것
  • 로컬 LLM 도입 시 RAM 여유분(71GB 이상)과 발열 스케줄 관리를 함께 계획할 것
  • 민감 정보가 있는 경우 로컬 LLM을 통해 클라우드 유출 없이 운영 가능

transcript: 00-Inbox/youtube/YCirjfAurng.ko.vtt