20분
프로덕션 RAG, 이렇게 하면 망한다
Day 4: 프로덕션 RAG
프로덕션 RAG, 이렇게 하면 망한다
RAG 심화 > Day 4: 프로덕션 RAG
학습 목표
프로덕션 RAG 구현 시 자주 발생하는 실수를 파악한다 각 실수에 대한 해결책을 설명할 수 있다
프로덕션 RAG, 이렇게 하면 망한다
실수 1: Self-RAG 판단이 너무 느리다
에디터 로딩 중...
해결:
에디터 로딩 중...
실수 2: Corrective RAG의 대안 검색이 없다
에디터 로딩 중...
해결: 3단계 폴백
에디터 로딩 중...
실수 3: 안전 관련 질문을 Simple로 분류한다
에디터 로딩 중...
해결: 안전 키워드는 반드시 검색
에디터 로딩 중...
실수 4: 캐시를 무한정 유지한다
에디터 로딩 중...
해결: TTL + 문서 업데이트 시 무효화
에디터 로딩 중...
체크리스트
- Self-RAG 판단 지연 최적화 (규칙 기반 + 배치 평가)
- Corrective RAG 3단계 폴백 구현
- 안전 키워드 우선 감지 (LLM 분류 전)
- 캐시 TTL 설정 + 문서 업데이트 무효화
- 로깅: 전략 선택, 판단 결과, 응답 시간 기록