🏆45

Day 2 챌린지: 청킹 전략 최적화 실험

Day 2: 청킹 & 임베딩

요구사항

SOP 샘플 문서를 4가지 이상 청킹 전략으로 분할한다

각 전략의 청크 수, 평균 크기, 내용 보존도를 비교 분석한다

제조 도메인 쿼리 5개에 대해 각 전략별 검색 정확도를 비교한다

최적 전략을 선택하고 그 이유를 보고서로 작성한다

평가 기준
  • 4가지 이상 청킹 전략을 구현했는가
  • 비교 기준이 명확하고 정량적인가
  • 제조 도메인 특성을 반영한 분석인가
  • 최적 전략 선택의 근거가 논리적인가
보너스
  • 시맨틱 청킹(sentence-transformers 활용)을 구현한 경우
  • 실제 PDF 매뉴얼로 테스트한 경우
  • chunk_size / overlap 파라미터 튜닝 실험 포함