Day 2: 청킹 & 임베딩
RAG 기초 > Day 2: 청킹 & 임베딩
Q1. RecursiveCharacterTextSplitter의 chunk_size=500은 무엇을 의미하는가?
Q2. SOP 문서를 청킹할 때 가장 적합한 전략은?
Q3. overlap(중복)의 주된 목적은?
Q4. 한글 제조 문서 임베딩에 가장 적합한 오픈소스 모델은?
Q5. 코사인 유사도가 0.95일 때 의미하는 것은?
Q6. 다음 중 잘못된 것은?