🏆60

제조 현장 최적 Hybrid Search 구축

Day 2: Hybrid Search

요구사항

BM25 + Semantic 결합 Hybrid Search를 구현할 것

Score Fusion과 RRF 두 가지 방식을 모두 구현할 것

쿼리 유형별 적응형 alpha를 적용할 것

제조 도메인 토크나이저를 구현할 것 (코드/규격 보존)

최소 10개의 다양한 쿼리 유형에 대한 검색 품질 비교 결과를 제출할 것

평가 기준
  • BM25 인덱스 구축의 정확성 (토크나이징 품질)
  • Score Fusion의 정규화 및 가중치 적용
  • RRF 구현의 정확성
  • 적응형 alpha의 쿼리 분류 정확도
  • 코드/규격 쿼리에서 Hybrid가 Semantic보다 나은지 검증
보너스
  • Query Expansion (동의어 사전 + LLM) 추가
  • HyDE 구현 및 일반 검색과 비교
  • Query Decomposition으로 복합 질문 처리
  • 최적 alpha 값을 자동 탐색하는 그리드 서치 구현