정의

RAG(Retrieval-Augmented Generation)는 외부 정보를 검색하여 LLM의 생성 과정을 개선하는 기술이다.

개념

기본 아이디어: “AI에게 오픈북 시험을 치게 한다”

  1. 질문 받음 → 2. 외부 자료 검색 → 3. 참고 + 생성 → 4. 답변 제시

구성 요소

1. Retrieval (검색)

  • 질문과 관련된 정보 검색
  • 벡터 검색 또는 그래프 검색
  • 근거 자료 수집

2. Generation (생성)

  • 검색된 정보를 바탕으로 답변 생성
  • 원본 학습 지식 + 검색 정보
  • 더 정확한 결과

장점

  • ✓ 환각(Hallucination) 감소
  • ✓ 최신 정보 활용 가능
  • ✓ 근거 기반 답변
  • ✓ 신뢰성 향상

그러나…

핵심 발견: “정보를 많이 주기만 해서는 안 된다”

중요한 것: 정보를 어떻게 조직화하는가

RAG의 미래

단순 RAG (구조화 없음)

  • 정보량 증가 ↑
  • 효율성 저하 ↓
  • 비용 상승 ↑

구조화된 RAG (KG + RAG)

  • 성능 극대화 ✓
  • 효율성 향상 ✓
  • 비용 절감 ✓

관련 개념