정의

**OG-RAG (Ontology-Grounded Retrieval-Augmented Generation)**는 RAG 시스템에 온톨로지(엄격한 논리 규칙)를 결합하여 논리적 오류 없는 답변을 생성하는 기법이다. LLM의 통계적 지식과 온톨로지의 논리적 제약을 동시에 활용.

핵심 아이디어

RAG의 한계:
├─ Knowledge Graph: 완전하지 않음 (빠진 정보 많음)
└─ LLM: 논리가 없음 (통계만 봄)

OG-RAG의 해결책:
├─ KG: 불완전하지만 구조화됨
├─ LLM: 방대하지만 비논리적
└─ 온톨로지: 논리 규칙으로 LLM 제약

결과:
└─ 논리적 오류 없는 생성 (Constraint-aware generation)

문제 사례: 아이언맨의 친구

질문: "아이언맨의 친구는?"

LLM만 사용:
├─ ✅ 캡틴 아메리카 (관련 영화 많음)
├─ ✅ 헐크 (팀 멤버)
├─ ✅ 블랙 위도우 (팀 멤버)
└─ ❌ 타노스 (영화에서 자주 상호작용)

왜?
├─ 통계: (아이언맨, 타노스) 빈도 높음
└─ LLM: "자주 나옴 = 친함" 착각

규칙 추가 후:
├─ 규칙: "If X is enemy of Y, then X ≠ friend of Y"
├─ 재평가: 타노스는 적이므로 제외
└─ ✅ 정답만 반환

4-Step OG-RAG Pipeline

단계역할입력출력
1. Rule Extraction지식 그래프에서 논리 규칙 추출KG논리 규칙 집합
2. NL Conversion딱딱한 규칙을 자연어로 변환규칙자연어 제약
3. Context Understanding데이터 구조 전체 파악KG 전체맥락 정보
4. Constraint-Aware Gen프롬프트에 규칙 포함하여 생성Q + Rules + Context논리적 답변

성능 개선

측정값: 지식 그래프 완성 정확도

기존 방법: 15.8%
OG-RAG: 20.1% (4.3%p 향상!)

Ablation Test (각 요소의 중요도):
├─ 규칙 추가 시: +4.3% ⭐ 가장 중요!
├─ 맥락 이해 시: +1.2%
└─ 자연어 변환 시: +0.8%

세 가지 규칙 유형

분류 규칙 (Classification Rules)

예시:
├─ "If married(X, Y) ∧ person(Y), then person(X)"
│  (배우자가 사람이면 본인도 사람)
└─ "If father(X, Y), then parent(X, Y)"

관계 규칙 (Relationship Rules)

예시:
├─ "If father(X, Y) ∧ spouse(X, Z), then mother(Z, Y)"
│  (아버지의 배우자는 어머니)
└─ "If friend(X, Y) ∧ friend(Y, Z), then possibly_friend(X, Z)"
   (친구의 친구는 친구일 가능성)

제약 규칙 (Constraint Rules)

예시:
├─ "¬(enemy(X, Y) ∧ friend(X, Y))"
│  (적이면서 친구 불가)
├─ "¬(father(X, Y) ∧ father(X, Z) ∧ Y ≠ Z ∧ ...)"
│  (한 사람이 다른 두 아이의 아버지일 수 없음)
└─ "If deceased(X), then ¬currently_employed(X)"

응용 분야

  1. 금융: 기업 신용도, 위험도 평가 (규제 규칙 준수)
  2. 의료: 진단, 약물 상호작용 금기 (의료 규칙 적용)
  3. 법률: 판례 분석, 일관된 판결 (법적 논리 유지)
  4. 과학: 실험 결과 해석 (논리적 일관성 검증)

관련 개념


핵심: OG-RAG는 “통계 지능에 논리를 입혀주는” 기술이다. 신뢰 가능한 AI로의 첫 발걸음.