🏆45분
Day 2 챌린지: 청킹 전략 최적화 실험
Day 2: 청킹 & 임베딩
Day 2 챌린지: 청킹 전략 최적화 실험
RAG 기초 > Day 2: 청킹 & 임베딩
요구사항
SOP 샘플 문서를 4가지 이상 청킹 전략으로 분할한다
각 전략의 청크 수, 평균 크기, 내용 보존도를 비교 분석한다
제조 도메인 쿼리 5개에 대해 각 전략별 검색 정확도를 비교한다
최적 전략을 선택하고 그 이유를 보고서로 작성한다
평가 기준
- • 4가지 이상 청킹 전략을 구현했는가
- • 비교 기준이 명확하고 정량적인가
- • 제조 도메인 특성을 반영한 분석인가
- • 최적 전략 선택의 근거가 논리적인가
보너스
- • 시맨틱 청킹(sentence-transformers 활용)을 구현한 경우
- • 실제 PDF 매뉴얼로 테스트한 경우
- • chunk_size / overlap 파라미터 튜닝 실험 포함