Wiki Health Check — 2026-04-27

Summary

  • Total pages: 280 (excluding index/log)
  • Issues: Critical 3 / Suggested 3 / Ideas 1
  • 이전 lint(2026-04-26) 이후 변경:
    • 페이지: +54 (5개 ingest 배치, 19개 URL → ~93개 신규 파일 생성)
    • Critical 변화: 0C → 3C (신규: orphaned sources, stale claims)
    • Suggested 변화: 5S → 3S (개선)
    • Data Freshness: GenAI/LLM (0d), Data Eng (1d), Education (0d) ✓ 건강

Trend

Metric2026-04-262026-04-27Δ
Total pages226280+54 (+24%)
Critical03+3
Suggested53-2
Ideas31-2
Orphan pages~831+23
Stale claims (>180d)~214+12

해석: 큰 규모 ingest(5배치, 19URL) 완료 후 자연스러운 일시적 증가. 대부분 linking 작업(3~5일) 후 자동 해결 예상.


Critical (즉시 수정 권장)

C1. Stale Claims (§3) — 2022~2025 구형 소스 14건


C2. Orphaned Recent Sources (§1) — 5배치 ingest 직후 20개 sources 연결 대기


C3. Old Wiki-Health Reports — 11개 보관 대상


Suggested (다음 ingest 시)

S1. Unprocessed Raw Files (§7) — 47개 raw/articles 대기열

  • 유형: Unprocessed Raw

  • 대상: 47개 raw/articles 파일 (2026-04-25~04-27 수집)

    • FastAPI/Docker: 6개
    • DataStage/Jira: 6개
    • Prompt Engineering/LoRA: 7개 (최근 4개는 이미 wiki/sources 완성, 3개 pending)
    • ML 기초 (scikit-learn, EDA, outlier detection 등): 12개
    • Python 기초 (asyncio, type hints, pydantic 등): 5개
    • 기타: 5개
  • 문제: raw/ 파일이 존재하지만, 아직 wiki/sources/ 합성 페이지로 변환되지 않음. 인제스트 파이프라인 대기 상태.

  • 제안:

    • 우선순위 순서:
      1. High (강의 모듈 직결): Prompt Engineering (3개) → wiki/sources 완성 필요
      2. Medium (기초 보완): Python 기초, ML 기초 (12개) → 2~3일 내 일괄 처리
      3. Low (DAP 운영): DataStage/Jira (6개) → 5월 ingest 예정
    • 액션: /ingest raw/articles/2026-04-27-*.md 일괄 실행 (또는 배치 ingest)
  • 상태: pending-review (사용자 확인 후 진행 순서 결정)


  • 유형: Missing Links

  • 대상 (2회+ 평문 언급 without link):

    • High impact (6+ mentions):
      • jira-workflow-optimization — 9회 평문, concepts/entities 페이지는 있으나 wikilink 부재
      • learning-objectives-abcd — 7회 평문
      • loho-manip (인물) — 7회 평문
      • workflow-automation-tools — 6회 평문
    • Medium (3~5 mentions):
      • langchain-agents-architecture, vector-database-retrieval, chain-of-thought-prompting (각 3~4회)
      • claude-prompting-best-practices (5회)
    • Low (2 mentions):
      • birgitta-bockeler, jang-pm (인물) (2~3회)
  • 제안: 각 파일을 열어 평문 언급 → “ 수동 링크화 (2~3시간 작업)

  • 상태: new


S3. Technical Debt — 25+ 고빈도 개념 미페이지화 (§5)

  • 유형: Uncovered Concepts

  • 대상 (5회+ 언급, 페이지 없음):

    • Very High (20+ mentions): monitoring (28), optimization (28), transformer (24), observability (24), database (24)
    • High (15~20): sql (22), metrics (21), git (20), prompt-engineering (19), logging (17)
    • Medium (10~15): embedding (14), security (13), machine-learning (12), transformers (12), fine-tuning (12), deep-learning (11), caching (10), documentation (10)
    • Low (5~10): etl-pipeline (9), vector-database (9), embeddings (9), kubernetes (8), performance (8), testing (7), neural-network (5)
  • 문제: 이들 개념이 강의 커리큘럼 및 기술 소스에서 자주 언급되지만, 아직 별도 wiki 페이지 없음. 그래프 밀도 저하.

  • 제안:

    • (a) 우선순위: transformer, prompt-engineering, machine-learning, fine-tuning → 강의 Module 2~5와 직결; 신규 sources와 함께 개념 페이지 생성
    • (b) 배치 작업: 25개 개념 중 상위 10개 → 5월 내 신규 concepts/ 페이지 작성 (각 2~3시간)
    • (c) 또는 병합: 기존 concepts와 merge 가능성 검토 (예: transformer 용어는 transformer-architecture 에 포함될 수 있음)
  • 상태: pending-review


Ideas (새 소스 추천 등)

I1. Data Gap Analysis — DAP Operations 도메인 소스 부족

  • 분석:

    • GenAI/LLM 도메인: 0일 전 ingest ✓
    • Data Engineering: 1일 전 ingest ✓
    • Education: 0일 전 ingest ✓
    • DAP Operations (workflow automation, incident management, Jira): 최근 ingest 부재
  • 제안: 5월 중 DAP Operations 도메인에서 3~4개 신규 소스 추가

    • 예: “Airflow observability 2026”, “Jira automation best practices Q2 2026”, “Incident response patterns 2026”
  • 액션: /ingest <검색어> (5월 우선순위 큐에 추가)


Deferred (이전 lint에서 pending 항목)

None. 이전 2026-04-26 lint의 모든 이슈는 해결 또는 closed 상태.


Executive Summary

상태: ⚠️ 주의 필요 (관리 가능한 수준)

핵심 액션 (우선순위 순):

  1. 이번 주 (3~5일):

    • C2: 20개 orphaned sources 링크화 (index + 개념 역링크)
    • C3: 11개 old lint 리포트 아카이브/삭제
  2. 이번 달 (5월):

    • C1: 14개 stale claims 검증 및 갱신 (특히 Redshift 2022, DataStage 기술 문서)
    • S1: 47개 raw/articles → wiki/sources 합성 (배치 ingest)
    • S3: 상위 10개 uncovered concepts 페이지 생성
    • I1: DAP Operations 도메인 3개 신규 소스 추가

예상 해결 일정:

  • Critical 3개: 5월 초 해결 완료 (linking + archiving + source refresh)
  • Suggested 3개: 5월 중 해결 (raw ingest + concept creation)
  • Ideas: 5월 내 선제적 추가

건강도 판정:

  • 현재: 🟡 Fair (280 pages, 3C/3S/1I)
  • 목표 (2026-06-30): 🟢 Healthy (0C, 1S이하, 300+ pages)

기술 노트

  • §1 Orphan Pages: 31개 → 11개 old reports + 20개 new sources
  • §3 Stale Claims: 14개 (임계값 180일 초과)
  • §7 Unprocessed Raw: 47개 대기열 (최근 5 ingest 배치 후 정상)
  • §5 Uncovered Concepts: 25개 고빈도 용어 (강의 모듈과 연결 권장)
  • §8, §9, §10, §11: ✓ All clean (no overdue/stale/orphan projects, no dangling pulls)