Definition
RIGOR (Retrieval-Integrated GeneratOr for ontology Requirements)는 LLM과 RAG를 활용하여 고품질 온톨로지를 자동으로 생성하는 AI 시스템이다.
Problem It Solves
전통적 온톨로지 구축:
- 전문가가 수작업으로 설계 (시간, 비용 막대함)
- 불완전한 결과 (다른 지식과 미연결)
- 확장성 낮음 (새 도메인마다 처음부터 시작)
RIGOR의 핵심: LLM의 창의성 + RAG의 지식 접근권 + 이중 검증 프로세스
Architecture: AI Librarian Team
RIGOR은 두 명의 핵심 LLM 멤버로 구성:
1. Generator (생성자)
- 역할: 카탈로그 초안 창의적 작성
- 특징: 풍부한 맥락 활용, 새로운 아이디어 제시
- RAG 접근: 전 세계 지식베이스 참조 가능
2. Reviewer (심판자)
- 역할: 초안의 꼼꼼하고 냉철한 검토
- 특징: 엄격한 기준 적용, 오류 포착
- 기능:
- 정확성(accuracy) 검증
- 누락된 내용(completeness) 확인
- 불필요한 군더더기 제거
- 이해 난이도(understandability) 평가
Work Process
1. 선택 (Selection)
├─ 데이터 창고에서 1개 테이블 선택
2. 조사 (Investigation)
├─ RAG를 활용하여 관련 정보 전부 조사
3. 생성 (Generation)
├─ Generator가 카탈로그 초안 작성 (🎨 창의성)
4. 검토 (Review)
├─ Reviewer가 꼼꼼히 검토 (🔍 정확성)
5. 완성 (Finalization)
├─ 완벽해지면 마스터 카탈로그에 추가
6. 반복 (Iteration)
└─ 다음 테이블로 진행 (모든 테이블 완료까지 반복)
Secret Weapon: RAG
RAG (Retrieval-Augmented Generation)는 RIGOR에게:
- 전 세계 지식 도서관 접근권 제공 (library access pass)
- AI가 상상에서 글 쓰는 것 아님 → 기존 문서 검색·참조
- 훨씬 정확하고 맥락에 맞는 카탈로그 생성 가능
Key Performance Results
Prior Simple AI Methods
- 결과: 쓸 만한 결과물 생성 불가
- 성공률: 거의 0% → 시작조차 못 함
RIGOR Performance
복잡한 질문에 대한 답변 품질:
- Previous method: 1.5/5.0 점수
- RIGOR: 4.6/5.0 점수 ✅ 3배 이상 우수
품질 평가 기준 (독립적 AI 심판관):
- ✅ 정확성 (accuracy)
- ✅ 완전성 (completeness) — 누락 없음
- ✅ 간결성 (clarity) — 군더더기 제거
- ✅ 이해 용이성 (understandability) — 명확한 표현
원본 데이터 반영도: 72.4%
- RIGOR이 만든 카탈로그는 단순 창작이 아님
- 원본 데이터의 72% 이상 정확하게 반영
Conclusion
RIGOR은:
- 자동 온톨로지 생성을 통해 수십 년의 숙제 해결
- Master-Catalog 구축을 실용화
- Data-Silo를 Smart-Library로 변환하는 열쇠
References
- rag-ontologies-relational.md — RIGOR 상세 설명
- RAG-for-Ontology — RAG의 온톨로지 구축 역할
- Generator-Reviewer-Pattern — 이중 검증 아키텍처
- Master-Catalog — RIGOR의 최종 산출물