8 Retrieval Augmented Generation of Ontologies

Summary

RAG (Retrieval-Augmented Generation)를 활용하여 고품질 온톨로지를 자동으로 생성하는 RIGOR 시스템 소개. 데이터 사일로 문제 해결, Master Catalog 자동 구축, AI 사서팀(Generator + Reviewer) 협업 패턴, 4.6/5.0 품질 점수 및 72.4% 정확도 달성을 통해 온톨로지 생성의 근본적 혁신을 제시함.

Key Claims

데이터 사일로 문제: 독립적 데이터 저장소들이 상호 연결 불가능 → 의미 있는 질문 거의 불가능
Master Catalog 필요: 온톨로지는 도서관의 카탈로그처럼 모든 정보의 위치·주제·관계를 정의하는 규칙서
전통 온톨로지 구축의 어려움: 전문가 수작업 필요 → 시간·비용 막대함 → 불완전한 결과 → 확장 불가
RIGOR 혁신: LLM + RAG + Generator-Reviewer 패턴으로 고품질 온톨로지 자동 생성 가능
RAG의 역할: AI에게 전 세계 지식베이스 접근 권한 부여 → 상상이 아닌 팩트 기반 생성
이중 검증의 우수성: Generator (창의성) + Reviewer (정확성) 협력 → 4.6/5.0 품질 점수 달성
성능 비교: 기존 단순 AI 방법(1.5/5.0 점수) vs RIGOR(4.6/5.0 점수) → 3배 이상 우수
원본 데이터 반영: RIGOR 생성 온톨로지는 원본 데이터의 72% 이상 정확하게 반영 (단순 창작이 아님)

Key Concepts (Video 11에서 새로 소개)

Data-Silo — 독립적 데이터 저장소, 서로 미연결 문제
Master-Catalog — 온톨로지 구축의 목표, 도서관 카탈로그 메타포
Smart-Library — Master Catalog가 실현하는 최종 상태, 모든 정보가 태깅·연결
RIGOR — Retrieval-Integrated GeneratOr for ontology Requirements 시스템
RAG-for-Ontology — RAG를 온톨로지 구축에 적용하는 기법
Generator-Reviewer-Pattern — 이중 LLM 협업 패턴 (창의성 + 정확성)
Ontology-Quality-Metrics — 온톨로지 품질 평가 기준 (Accuracy, Completeness, Clarity, Consistency)

Ontology — 지식의 구조화된 표현
LLM — 대규모 언어 모델
Knowledge Graph — 구조화된 지식 그래프
Graph RAG — 그래프 기반 RAG
RAG — 검색 증강 생성
Entity Extraction — 개체 추출

RIGOR System Architecture

Problem: Data Silos

전 세계 데이터베이스 (의료, 금융, 과학 등)
└─ 각각 다른 언어, 구조, 포맷
└─ 서로 연결되지 않은 거대한 섬 (islands)
└─ 의미 있는 교차 질문 불가능

Solution: RIGOR + RAG

1. 문제 인식
   "데이터 창고(Warehouse) → 스마트 라이브러리(Smart Library)로 변환"

2. RIGOR 아키텍처
   AI Librarian Team:
   ├─ Generator: 창의적 카탈로그 초안 작성 (🎨 창의성)
   ├─ Reviewer: 꼼꼼한 검토·개선 (🔍 정확성)
   └─ RAG: 전 세계 지식베이스 접근 (📚 팩트 기반)

3. 워크플로우
   Data Table Selection
   → RAG Investigation (관련 정보 전부 조사)
   → Generator Draft (초안 생성)
   → Reviewer Check (정확성·완전성·명확성·일관성 검증)
   → Master Catalog Integration (카탈로그에 추가)
   → Next Table (반복)

4. 결과
   ├─ 품질: 4.6/5.0 (기존 1.5/5.0 대비 3배↑)
   ├─ 정확도: 72.4% (원본 데이터 반영)
   └─ 가능성: 수십 년 숙제 해결 (자동화)

Quality Assessment Criteria

Reviewer는 4가지 기준으로 엄격히 평가:

기준	평가 포인트
Accuracy (정확성)	팩트 기반, 논리적 오류 없음
Completeness (완전성)	누락된 내용 없음
Clarity (명확성)	이해하기 쉬운 표현
Consistency (일관성)	다른 개념과 모순 없음

모든 기준에서 4.6/5.0 달성 = 매우 높은 수준의 온톨로지

Performance Benchmark

Prior Simple AI Methods

결과: 쓸 만한 결과물 생성 불가
성공률: 거의 0% (시작조차 못 함)

RIGOR Performance

복잡한 질문 답변 품질:
  Prior method: 1.5/5.0
  RIGOR:        4.6/5.0 ✅ (3배 이상 우수)

원본 데이터 반영도:
  72.4% (단순 창작 X, 팩트 기반 O)

평가 결과:
  독립적 AI 심판관이 Accuracy, Completeness, 
  Clarity, Consistency 모든 면에서 
  4.6/5.0의 높은 점수 부여

Vision: The Future

모든 데이터가 하나의 언어로 대화할 수 있다면?

의료 × 금융 × 과학 데이터 통합
지금까지 불가능했던 새로운 질문 가능
인류가 던질 새로운 질문들 → 무한한 가능성

RIGOR이 제공하는 열쇠: Data-Silo → Smart-Library 변환의 실질적 해결책

Contradictions

현재 정보 없음

출처: AI인터시스브랜드 채널, Video 11 (2025-12-16) 영상: “8 Retrieval Augmented Generation of Ontologies” (Part 2) 직역: “온톨로지의 검색 증강 생성” 길이: 약 7:56 (476초)

JYP Garden

탐색기

8 Retrieval Augmented Generation of Ontologies

Summary

Key Claims

Key Concepts (Video 11에서 새로 소개)

RIGOR System Architecture

Problem: Data Silos

Solution: RIGOR + RAG

Quality Assessment Criteria

Performance Benchmark

Prior Simple AI Methods

RIGOR Performance

Vision: The Future

Contradictions

그래프 뷰

목차

JYP Garden

탐색기

8 Retrieval Augmented Generation of Ontologies

Summary

Key Claims

Key Concepts (Video 11에서 새로 소개)

Related Concepts (기존)

RIGOR System Architecture

Problem: Data Silos

Solution: RIGOR + RAG

Quality Assessment Criteria

Performance Benchmark

Prior Simple AI Methods

RIGOR Performance

Vision: The Future

Contradictions

그래프 뷰

목차