type: source status: seedling title: OG-RAG: Ontology-Grounded Retrieval-Augmented Generation tags: [rag, ontology, knowledge-graph, logical-reasoning, constraint-satisfaction] created: 2026-05-05 modified: 2025-12-17 date: 2025-12-17 url: https://www.youtube.com/watch?v=J2Va_1p-9FE channel: AI인터시스브랜드 source_file: raw/youtube/og-rag.md
Summary
온톨로지 기반 검색 증강 생성 (OG-RAG)을 통한 논리적 AI의 실현. LLM의 방대한 지식은 있지만 논리적 추론 능력이 부족하다는 근본 문제에서 출발. 지식 그래프의 불완전성과 LLM의 비논리성 문제를 동시에 해결하기 위해, 온톨로지(엄격한 규칙집)를 LLM과 결합. 4단계 파이프라인을 통해 규칙을 추출하고 자연어로 변환한 후, 이를 프롬프트에 포함시켜 논리적 오류가 없는 답변을 생성. 실험 결과 15.8%에서 20.1%로의 성능 향상을 달성하며, 금융·의료·법률 분야의 혁신적 응용 가능성을 제시.
Key Claims
- 지식 그래프의 문제: 항상 불완전 (빠진 정보 많음) → 신뢰성 낮음
- LLM의 약점: 통계적 관련성만 봄, 논리적으로 생각하지 않음
- 구체적 사례: 아이언맨의 친구를 찾을 때, 적인 타노스도 답에 포함 (관련성 때문)
- 근본 원인: “적은 친구가 될 수 없다”는 논리 규칙 부재
- 해결책: 온톨로지(규칙집)를 LLM과 결합
- 온톨로지의 내용: 분류 규칙, 관계 규칙, 제약 조건 규칙
- OG-RAG 원리: 규칙 추출 → 자연어 변환 → 맥락 추가 → 논리적 답변
- 성능 개선: 규칙 추가만으로 4.3%p 향상 (15.8% → 20.1%)
- ablation test: 온톨로지를 빼면 성능이 가장 크게 떨어짐 (가장 중요한 요소)
- 신뢰성 혁신: 단순 정보 제공에서 논리적 추론으로의 진화
Key Concepts Created
- OG-RAG — 온톨로지 기반 RAG
- Knowledge Graph — AI의 뇌, 주체-관계-객체 구조
- Ontology-based Constraint — 온톨로지의 제약 규칙
- Logical Reasoning — 논리적 추론 능력
- Rule Extraction — 온톨로지에서 규칙 추출
- Trustworthy AI — 신뢰 가능한 AI 시스템
- Neuro-Symbolic Integration — 신경망과 기호 추론의 결합
The Core Problem: Logic vs Statistics
지식 그래프 (Knowledge Graph):
├─ 구조: 주체 ─(관계)─> 객체
├─ 예: (아이언맨) ─(아내)─> (페퍼포츠)
├─ 장점: 명확하고 구조화됨
└─ 문제: 항상 불완전 (빠진 정보 많음)
LLM (Large Language Model):
├─ 강점: 방대한 데이터로부터 패턴 학습
├─ 약점: 통계적 관련성만 봄
└─ 예: (아이언맨) ↔ (타노스)의 빈도가 높으면 친구로 착각
근본 차이:
├─ 지식 그래프: 논리적 (IF-THEN)
├─ LLM: 통계적 (확률 기반)
└─ 결합 필요: 둘의 장점을 합치기
The Motivating Example: Iron Man’s Friends
질문: "아이언맨의 친구는?"
LLM의 답변:
├─ ✅ 캡틴 아메리카
├─ ✅ 헐크
├─ ✅ 블랙 위도우
└─ ❌ 타노스 (적인데도!)
왜 실수할까?
├─ 통계: (아이언맨, 타노스) = 많은 영화 장면에서 상호작용
├─ LLM의 판단: "자주 나오는 캐릭터 = 친한 사이"
└─ 논리: "적은 친구가 될 수 없다" ← 이 규칙 몰랐음
필요한 것:
└─ "적 ∉ 친구" 규칙을 명시적으로 제공
OG-RAG: 4-Step Pipeline
Step 1: Rule Extraction (규칙 추출)
지식 그래프로부터 논리 규칙 추출:
분류 규칙:
├─ person(X) ← married(X, Y) ∧ person(Y)
│ (부인이 사람이면 본인도 사람)
└─ father(X, Y) → parent(X, Y)
관계 규칙:
├─ spouse(X, Y) ← married(X, Y)
├─ mother(X, Y) ← father(Z, Y) ∧ spouse(X, Z)
│ (아버지의 아내는 어머니)
제약 규칙:
├─ ¬ (enemy(X, Y) ∧ friend(X, Y))
│ (적이면 친구 불가)
└─ ¬ (father(X, Y) ∧ father(X, Z) ∧ Y ≠ Z ∧ mother_of(Y) = mother_of(Z))
Step 2: Natural Language Conversion (자연어 변환)
딱딱한 논리 규칙 → LLM이 이해하는 자연어:
논리 형식:
└─ ¬ (enemy(X, Y) ∧ friend(X, Y))
자연어 형식:
└─ "If X is an enemy of Y, then X cannot be a friend of Y"
장점:
├─ LLM이 자연어로 학습했기에 쉽게 이해
└─ 규칙을 문맥에 반영 가능
Step 3: Context Understanding (맥락 이해)
지식 그래프의 전체 구조 파악:
마블 유니버스 예:
├─ 어벤저스: {캡틴, 헐크, 아이언맨, 블랙위도우, ...}
├─ 관계: (캡틴, 친구, 아이언맨)
├─ 관계: (아이언맨, 적, 타노스)
└─ AI가 "큰 그림" 이해 → 맥락 인식
결과:
└─ 규칙이 어떤 상황에서 적용되는지 파악
Step 4: Constraint-Aware Generation (제약 조건 기반 생성)
질문과 함께 제공되는 정보:
프롬프트:
├─ Question: "Who are Iron Man's friends?"
├─ Knowledge Graph Data: [관련 엔티티와 관계]
├─ Ontology Rules: [제약 규칙]
│ └─ "If X is enemy of Y, then X cannot be friend of Y"
└─ Context: [관련 개인 정보]
LLM의 추론:
├─ 타노스를 생각했지만...
├─ "Wait, 타노스는 적이라는 규칙이 있네"
└─ 제거 → 올바른 친구 목록만 반환
결과:
└─ 논리적 오류 없는 답변 생성
Performance Improvement
실험 결과:
기준:
├─ 지식 그래프만: 15.8%
├─ LLM만: 변동 있음 (환각 위험)
└─ LLM + 기본 제약: ~18%
OG-RAG:
└─ 최대 20.1% (4.3%p 향상!)
Ablation Test (각 요소 제거 시 성능 변화):
├─ 규칙 제거 시: ↓ 4.3%p (가장 큼)
├─ 데이터 구조 제거 시: ↓ 1.2%p
├─ 자연어 변환 제거 시: ↓ 0.8%p
└─ 결론: 온톨로지 규칙이 가장 중요한 요소!
Real-World Applications
1. 금융 (Finance)
시나리오:
├─ 복잡한 기업 관계 네트워크
├─ 규제 제약 조건
└─ "회사 A의 신용도는?"
제약 규칙:
├─ "빚을 진 회사는 신뢰도 감소"
├─ "자회사가 문제면 모회사도 문제"
├─ "파산한 관계자와 거래하면 위험"
OG-RAG의 역할:
├─ 규칙을 명시적으로 적용
├─ 통계만으로는 놓칠 위험 예측
└─ 규제 준수 자동화 가능
결과:
└─ 위험 예측 정확도 대폭 향상
2. 의료 (Healthcare)
시나리오:
├─ 환자의 증상, 병력, 유전 정보
├─ 약물 상호작용 금기
└─ "진단은?"
제약 규칙:
├─ "X 약물은 Y 질환에 금기"
├─ "증상 A + 증상 B → 질병 C일 가능성"
├─ "알레르기 있으면 유사 약물도 피해야"
OG-RAG의 역할:
├─ 의료 지식을 논리적으로 적용
├─ 모순 없는 진단 보장
└─ 환자 맞춤 치료 계획
결과:
└─ 진단 정확도 및 안전성 향상
3. 법률 (Legal)
시나리오:
├─ 수천 개의 판례
├─ 법률 규칙 및 해석
└─ "이 경우의 판결은?"
제약 규칙:
├─ "선례와 모순되면 안 됨"
├─ "법적 지위에 따른 판결 원칙"
├─ "증거의 증거성 판단 규칙"
OG-RAG의 역할:
├─ 판례의 논리적 일관성 보장
├─ 새로운 경우에 논리 확장
└─ 편견 없는 판결 보조
결과:
└─ 일관되고 공정한 법률 해석
The Bigger Picture: Towards Trustworthy AI
문제의 진화:
Level 1 (과거):
├─ "AI가 답을 줄 수 있을까?"
└─ 답: 기술 진전
Level 2 (현재):
├─ "AI의 답이 정확할까?"
└─ 답: 성능 개선 (LLM의 강점)
Level 3 (OG-RAG):
├─ "AI의 논리가 올바를까?"
└─ 답: 온톨로지 기반 제약 추가
Level 4 (미래):
├─ "AI의 판단을 신뢰할 수 있을까?"
└─ 답: 지식 + 논리 + 설명 가능성의 조합
OG-RAG의 의의:
└─ Level 3에서 Level 4로 가는 첫 발걸음
Related Concepts
- RAG — 검색 증강 생성의 기초
- Knowledge Graph — 지식 구조
- Ontology — 논리 규칙 표현
- Logical Reasoning — 논리적 추론
- Constraint Satisfaction — 제약 조건 만족
- Neuro-Symbolic AI — 신경망과 기호 AI의 결합
- Knowledge Graph Completion — 빈 정보 채우기
- Trustworthy AI — 신뢰 가능한 AI
Critical Questions
- 온톨로지의 규칙이 항상 정확한가?
- 새로운 영역에 규칙을 어떻게 정의할 것인가?
- 규칙이 과도하게 제약적이면 유연성은?
- 규칙 충돌이 발생하면 어떻게 해결할 것인가?
출처: AI인터시스브랜드 채널 (2025-12-17)
영상: “11 OG-RAG: Ontology-Grounded Retrieval-Augmented Generation”
영상 ID: J2Va_1p-9FE
길이: 약 5:37 (337초)
핵심: 온톨로지로 LLM의 논리성을 강화하여 신뢰 가능한 AI 구현