15분
잘 만들었는데 왜 엉뚱한 답이 나오지?
Day 2: 청킹 & 임베딩
잘 만들었는데 왜 엉뚱한 답이 나오지?
RAG 기초 > Day 2: 청킹 & 임베딩
학습 목표
청킹 전략이 RAG 품질에 미치는 영향을 체감한다 잘못된 청킹의 실제 결과를 이해한다
잘 만들었는데 왜 엉뚱한 답이 나오지?
"RAG 시스템 시연 준비 끝났습니다."
김 대리가 자신 있게 말했다. 팀장 앞에서 제조 문서 Q&A 데모를 보여줄 차례다.
에디터 로딩 중...
팀장이 인상을 찌푸렸다. "이거 답이 아닌데?"
왜 이런 일이 생겼을까?
원인은 청킹이었다.
김 대리는 매뉴얼 전체를 500자 단위로 잘랐다. 그런데 사양표가 이렇게 잘렸다:
에디터 로딩 중...
"스트로크: 350 mm"이 두 청크로 쪼개졌다. 벡터 검색에서 "최대 가압력"은 청크 A에만 있지만, 유사도 점수가 청크 B보다 낮아서 청크 B가 반환되었다.
청킹을 잘못하면 RAG는 쓸모없다.
이 문제를 해결하는 방법을 오늘 배운다.