20분
Hybrid Search 성능 튜닝 전략
Day 2: Hybrid Search
Hybrid Search 성능 튜닝 전략
RAG 심화 > Day 2: Hybrid Search
학습 목표
Hybrid Search의 alpha 파라미터 튜닝 방법을 이해한다 RRF(Reciprocal Rank Fusion)와 Score Fusion의 차이를 설명할 수 있다 제조 현장 쿼리 유형별 최적 가중치를 결정하는 기준을 안다
Hybrid Search 성능 튜닝
Alpha 파라미터란?
alpha는 BM25(키워드)와 Semantic(의미) 검색의 가중치 비율이다.
에디터 로딩 중...
제조 쿼리 유형별 최적 alpha
| 쿼리 유형 | 예시 | 최적 alpha | 이유 |
|---|---|---|---|
| 에러 코드 | E-4521, W-1105 | 0.2 | 코드 정확 매칭 필요 |
| 규격/표준 | ISO 9001, KS B 1234 | 0.25 | 표준 번호 정확 매칭 |
| 증상 설명 | 진동이 심하고 온도 상승 | 0.8 | 의미 기반 검색 효과 |
| 절차 질의 | 금형 교체 방법 | 0.7 | 개념적 유사성 중요 |
| 부품 조회 | 베어링 7210C | 0.4 | 이름+의미 혼합 |
RRF vs Score Fusion
Score Fusion: 점수를 직접 합산
에디터 로딩 중...
RRF (Reciprocal Rank Fusion): 순위 기반 합산
에디터 로딩 중...
| 비교 | Score Fusion | RRF |
|---|---|---|
| 장점 | alpha로 세밀 조절 | 파라미터 불필요 |
| 단점 | 정규화 필수, alpha 튜닝 | 점수 차이 반영 약함 |
| 적합 | 쿼리 유형 예측 가능 | 다양한 쿼리 처리 |
A/B 테스트로 alpha 최적화
에디터 로딩 중...
실무 팁: 제조 현장은 에러 코드/규격 번호 쿼리가 많으므로 alpha=0.3~0.4가 일반적으로 좋은 출발점이다.
핵심 포인트
- • alpha는 BM25와 Semantic 가중치 비율 — 에러코드 쿼리는 낮게(0.2), 증상 쿼리는 높게(0.8)
- • RRF는 파라미터 없이 안정적, Score Fusion은 alpha 튜닝으로 세밀 제어 가능
- • A/B 테스트로 실제 쿼리 데이터 기반 최적 alpha를 결정한다