▶️25

[영상] 오픈소스 RAG 파이프라인 구축 가이드

Day 4: 프로덕션 RAG

학습 목표

프로덕션 RAG 운영 3요소(캐싱, 재시도, 관측)의 역할을 설명할 수 있다 Redis 시맨틱 캐싱과 단순 키-값 캐싱의 차이를 구분할 수 있다 분산 추적으로 RAG 파이프라인 병목을 찾는 방법을 설명할 수 있다 오픈소스 RAG 스택(LangChain + Qdrant + LangFuse)으로 프로덕션 시스템을 구성할 수 있다

플레이어 로딩 중...
핵심 포인트
  • 시맨틱 캐시: 코사인 유사도 >0.95이면 재검색 없이 캐시 반환 — API 비용 60~70% 절감
  • 재시도: 지수 백오프(1s → 2s → 4s)로 일시 장애 대응, 최대 3회
  • LangFuse: 각 RAG 단계별 레이턴시·비용 추적
  • 3대 관측: 검색 P99 <500ms, 캐시 히트율 >40%, Faithfulness >0.85