▶️25분
[영상] 오픈소스 RAG 파이프라인 구축 가이드
Day 4: 프로덕션 RAG
[영상] 오픈소스 RAG 파이프라인 구축 가이드
RAG 심화 > Day 4: 프로덕션 RAG
학습 목표
프로덕션 RAG 운영 3요소(캐싱, 재시도, 관측)의 역할을 설명할 수 있다 Redis 시맨틱 캐싱과 단순 키-값 캐싱의 차이를 구분할 수 있다 분산 추적으로 RAG 파이프라인 병목을 찾는 방법을 설명할 수 있다 오픈소스 RAG 스택(LangChain + Qdrant + LangFuse)으로 프로덕션 시스템을 구성할 수 있다
플레이어 로딩 중...
핵심 포인트
- • 시맨틱 캐시: 코사인 유사도 >0.95이면 재검색 없이 캐시 반환 — API 비용 60~70% 절감
- • 재시도: 지수 백오프(1s → 2s → 4s)로 일시 장애 대응, 최대 3회
- • LangFuse: 각 RAG 단계별 레이턴시·비용 추적
- • 3대 관측: 검색 P99 <500ms, 캐시 히트율 >40%, Faithfulness >0.85