🏆60분
제조 현장 최적 Hybrid Search 구축
Day 2: Hybrid Search
제조 현장 최적 Hybrid Search 구축
RAG 심화 > Day 2: Hybrid Search
요구사항
BM25 + Semantic 결합 Hybrid Search를 구현할 것
Score Fusion과 RRF 두 가지 방식을 모두 구현할 것
쿼리 유형별 적응형 alpha를 적용할 것
제조 도메인 토크나이저를 구현할 것 (코드/규격 보존)
최소 10개의 다양한 쿼리 유형에 대한 검색 품질 비교 결과를 제출할 것
평가 기준
- • BM25 인덱스 구축의 정확성 (토크나이징 품질)
- • Score Fusion의 정규화 및 가중치 적용
- • RRF 구현의 정확성
- • 적응형 alpha의 쿼리 분류 정확도
- • 코드/규격 쿼리에서 Hybrid가 Semantic보다 나은지 검증
보너스
- • Query Expansion (동의어 사전 + LLM) 추가
- • HyDE 구현 및 일반 검색과 비교
- • Query Decomposition으로 복합 질문 처리
- • 최적 alpha 값을 자동 탐색하는 그리드 서치 구현