정의

지식 구조화(Knowledge Structuring)는 비정형 정보를 체계적이고 의미 있는 구조로 변환하는 프로세스이다.

핵심 원칙

”구조가 성능을 결정한다”

같은 정보라도:

  • 비구조화된 형태 → 낮은 효율성
  • 구조화된 형태 → 높은 효율성

구조화의 차원

1. 관계성 (Relationships)

  • 개체 간의 연결 명시
  • “누가”, “무엇을”, “어떻게” 정의
  • 인과관계 표현

2. 계층성 (Hierarchy)

  • 상위-하위 개념
  • 분류 체계
  • 추상화 수준

3. 속성 (Attributes)

  • 각 개체의 특징
  • 메타데이터
  • 맥락 정보

효과

성능 향상

  • 검색 정확도 ↑
  • 추론 능력 ↑
  • 신뢰성 ↑

비용 효율화

  • 학습 횟수 감소
  • 처리 복잡성 감소
  • 유지보수 용이

실무 적용

데이터 정리 (Unstructured → Structured)

Text → 개체 추출 → 관계 정의 → 그래프 구축

온톨로지 기반 구조화

  • 클래스 정의
  • 관계 규칙
  • 제약 조건

관련 개념