정의
RAG(Retrieval-Augmented Generation)는 외부 정보를 검색하여 LLM의 생성 과정을 개선하는 기술이다.
개념
기본 아이디어: “AI에게 오픈북 시험을 치게 한다”
- 질문 받음 → 2. 외부 자료 검색 → 3. 참고 + 생성 → 4. 답변 제시
구성 요소
1. Retrieval (검색)
- 질문과 관련된 정보 검색
- 벡터 검색 또는 그래프 검색
- 근거 자료 수집
2. Generation (생성)
- 검색된 정보를 바탕으로 답변 생성
- 원본 학습 지식 + 검색 정보
- 더 정확한 결과
장점
- ✓ 환각(Hallucination) 감소
- ✓ 최신 정보 활용 가능
- ✓ 근거 기반 답변
- ✓ 신뢰성 향상
그러나…
핵심 발견: “정보를 많이 주기만 해서는 안 된다”
중요한 것: 정보를 어떻게 조직화하는가
RAG의 미래
단순 RAG (구조화 없음)
- 정보량 증가 ↑
- 효율성 저하 ↓
- 비용 상승 ↑
구조화된 RAG (KG + RAG)
- 성능 극대화 ✓
- 효율성 향상 ✓
- 비용 절감 ✓
관련 개념
- Knowledge Graph — 그래프 기반 RAG
- Vector Search — 벡터 기반 검색
- Information Retrieval — 정보 검색