▶️25

[영상] RAGAS 라이브러리로 RAG 성능 평가하기

Day 3: RAGAS 평가

학습 목표

RAGAS 라이브러리를 설치하고 평가 데이터셋을 구성할 수 있다 Faithfulness, Context Recall, Precision, Answer Relevancy 4개 지표를 코드로 산출할 수 있다 낮은 점수의 원인을 단계별로 진단하는 방법을 적용할 수 있다 testset_generator로 평가용 질문-정답 쌍을 자동 생성할 수 있다

플레이어 로딩 중...
핵심 포인트
  • RAGAS: 레이블 없이 LLM 판사로 RAG 4개 축 자동 평가
  • testset_generator: Simple/Reasoning/Multi-context 3종 질문 자동 생성
  • 평가 루프: 질문 → RAG → 답변+컨텍스트 수집 → ragas.evaluate() → 점수
  • Critical Path: Context Recall↓ → 청킹/임베딩, Faithfulness↓ → 프롬프트/온도