20

데모 RAG와 프로덕션 RAG는 다른 세계다

Day 4: 프로덕션 RAG

학습 목표

데모 수준 RAG와 프로덕션 RAG의 차이를 이해한다 Self-RAG, Corrective RAG, Adaptive RAG 패턴의 필요성을 파악한다 프로덕션 환경에서 발생하는 문제를 예측할 수 있다

목요일 오후, 배포 후 1주일

"RAG 시스템 배포했는데, 현장에서 불만이 들어와."

불만 내용을 정리해보니:

에디터 로딩 중...

세 가지 불만의 공통점: 기존 RAG는 모든 질문을 똑같이 처리한다.


Naive RAG의 한계

에디터 로딩 중...

고급 RAG 패턴 3가지

패턴핵심 아이디어해결하는 문제
Self-RAGLLM이 스스로 검색 필요성과 답변 품질을 판단불필요한 검색 방지 + 할루시네이션 감지
Corrective RAG검색 결과를 평가하고, 품질이 낮으면 보정잘못된 검색 결과 사용 방지
Adaptive RAG질문 난이도에 따라 전략을 선택효율성 최적화
에디터 로딩 중...

실제 효과 비교

에디터 로딩 중...
에디터 로딩 중...

이번 Day에서 배울 것

오늘이 끝나면:

  • Self-RAG (4가지 판단 토큰)를 이해하고 구현할 수 있다
  • Corrective RAG (검색 보정 패턴)를 구현할 수 있다
  • Adaptive RAG (적응형 전략 라우팅)를 구현할 수 있다
  • 세 패턴을 통합한 프로덕션 RAG 시스템을 만든다

시작하자.