▶️25분
[영상] RAGAS 라이브러리로 RAG 성능 평가하기
Day 3: RAGAS 평가
[영상] RAGAS 라이브러리로 RAG 성능 평가하기
RAG 심화 > Day 3: RAGAS 평가
학습 목표
RAGAS 라이브러리를 설치하고 평가 데이터셋을 구성할 수 있다 Faithfulness, Context Recall, Precision, Answer Relevancy 4개 지표를 코드로 산출할 수 있다 낮은 점수의 원인을 단계별로 진단하는 방법을 적용할 수 있다 testset_generator로 평가용 질문-정답 쌍을 자동 생성할 수 있다
플레이어 로딩 중...
핵심 포인트
- • RAGAS: 레이블 없이 LLM 판사로 RAG 4개 축 자동 평가
- • testset_generator: Simple/Reasoning/Multi-context 3종 질문 자동 생성
- • 평가 루프: 질문 → RAG → 답변+컨텍스트 수집 → ragas.evaluate() → 점수
- • Critical Path: Context Recall↓ → 청킹/임베딩, Faithfulness↓ → 프롬프트/온도