20분
데모 RAG와 프로덕션 RAG는 다른 세계다
Day 4: 프로덕션 RAG
데모 RAG와 프로덕션 RAG는 다른 세계다
RAG 심화 > Day 4: 프로덕션 RAG
학습 목표
데모 수준 RAG와 프로덕션 RAG의 차이를 이해한다 Self-RAG, Corrective RAG, Adaptive RAG 패턴의 필요성을 파악한다 프로덕션 환경에서 발생하는 문제를 예측할 수 있다
목요일 오후, 배포 후 1주일
"RAG 시스템 배포했는데, 현장에서 불만이 들어와."
불만 내용을 정리해보니:
에디터 로딩 중...
세 가지 불만의 공통점: 기존 RAG는 모든 질문을 똑같이 처리한다.
Naive RAG의 한계
에디터 로딩 중...
고급 RAG 패턴 3가지
| 패턴 | 핵심 아이디어 | 해결하는 문제 |
|---|---|---|
| Self-RAG | LLM이 스스로 검색 필요성과 답변 품질을 판단 | 불필요한 검색 방지 + 할루시네이션 감지 |
| Corrective RAG | 검색 결과를 평가하고, 품질이 낮으면 보정 | 잘못된 검색 결과 사용 방지 |
| Adaptive RAG | 질문 난이도에 따라 전략을 선택 | 효율성 최적화 |
에디터 로딩 중...
실제 효과 비교
에디터 로딩 중...
에디터 로딩 중...
이번 Day에서 배울 것
오늘이 끝나면:
- Self-RAG (4가지 판단 토큰)를 이해하고 구현할 수 있다
- Corrective RAG (검색 보정 패턴)를 구현할 수 있다
- Adaptive RAG (적응형 전략 라우팅)를 구현할 수 있다
- 세 패턴을 통합한 프로덕션 RAG 시스템을 만든다
시작하자.