20

프로덕션 RAG, 이렇게 하면 망한다

Day 4: 프로덕션 RAG

학습 목표

프로덕션 RAG 구현 시 자주 발생하는 실수를 파악한다 각 실수에 대한 해결책을 설명할 수 있다

프로덕션 RAG, 이렇게 하면 망한다


실수 1: Self-RAG 판단이 너무 느리다

에디터 로딩 중...

해결:

에디터 로딩 중...

실수 2: Corrective RAG의 대안 검색이 없다

에디터 로딩 중...

해결: 3단계 폴백

에디터 로딩 중...

실수 3: 안전 관련 질문을 Simple로 분류한다

에디터 로딩 중...

해결: 안전 키워드는 반드시 검색

에디터 로딩 중...

실수 4: 캐시를 무한정 유지한다

에디터 로딩 중...

해결: TTL + 문서 업데이트 시 무효화

에디터 로딩 중...

체크리스트

  • Self-RAG 판단 지연 최적화 (규칙 기반 + 배치 평가)
  • Corrective RAG 3단계 폴백 구현
  • 안전 키워드 우선 감지 (LLM 분류 전)
  • 캐시 TTL 설정 + 문서 업데이트 무효화
  • 로깅: 전략 선택, 판단 결과, 응답 시간 기록