25분
Hybrid Search, 이렇게 하면 망한다
Day 2: Hybrid Search
Hybrid Search, 이렇게 하면 망한다
RAG 심화 > Day 2: Hybrid Search
학습 목표
Hybrid Search 구현 시 자주 발생하는 실수를 파악한다 각 실수에 대한 해결책을 설명할 수 있다
Hybrid Search, 이렇게 하면 망한다
실수 1: 점수 정규화를 안 한다
에디터 로딩 중...
해결: Min-Max 정규화
에디터 로딩 중...
실수 2: alpha를 고정한다
에디터 로딩 중...
해결: 쿼리 유형별 적응형 alpha
에디터 로딩 중...
실수 3: 토크나이징 불일치
에디터 로딩 중...
해결: 동일한 토크나이저 사용
에디터 로딩 중...
실수 4: 검색 후보 수가 부족
에디터 로딩 중...
해결: initial_k를 final_k의 4~10배로
에디터 로딩 중...
실수 5: 메타데이터 필터를 안 쓴다
에디터 로딩 중...
해결: 사전 필터링
에디터 로딩 중...
Score Fusion vs RRF: 언제 뭘 쓸까?
| 기준 | Score Fusion | RRF |
|---|---|---|
| 장점 | alpha로 세밀 조절 가능 | 파라미터 최적화 불필요 |
| 단점 | 정규화 필수, alpha 튜닝 | 점수 차이 반영 약함 |
| 적합 | 쿼리 유형이 예측 가능할 때 | 다양한 쿼리가 올 때 |
| 제조 추천 | 적응형 alpha와 함께 | 빠른 프로토타이핑 |
체크리스트
- 점수 정규화 (Min-Max) 적용
- 쿼리 유형별 적응형 alpha 설정
- 인덱싱과 검색에 동일 토크나이저 사용
- initial_k를 final_k의 4배 이상으로 설정
- 메타데이터 필터 활용 (장비 코드, 문서 유형)