정의
지식 구조화(Knowledge Structuring)는 비정형 정보를 체계적이고 의미 있는 구조로 변환하는 프로세스이다.
핵심 원칙
”구조가 성능을 결정한다”
같은 정보라도:
- 비구조화된 형태 → 낮은 효율성
- 구조화된 형태 → 높은 효율성
구조화의 차원
1. 관계성 (Relationships)
- 개체 간의 연결 명시
- “누가”, “무엇을”, “어떻게” 정의
- 인과관계 표현
2. 계층성 (Hierarchy)
- 상위-하위 개념
- 분류 체계
- 추상화 수준
3. 속성 (Attributes)
- 각 개체의 특징
- 메타데이터
- 맥락 정보
효과
성능 향상
- 검색 정확도 ↑
- 추론 능력 ↑
- 신뢰성 ↑
비용 효율화
- 학습 횟수 감소
- 처리 복잡성 감소
- 유지보수 용이
실무 적용
데이터 정리 (Unstructured → Structured)
Text → 개체 추출 → 관계 정의 → 그래프 구축
온톨로지 기반 구조화
- 클래스 정의
- 관계 규칙
- 제약 조건
관련 개념
- Knowledge Graph — 그래프 형 지식 표현
- — 데이터 아키텍처
- Information Architecture — 정보 아키텍처