20

Hybrid Search 성능 튜닝 전략

Day 2: Hybrid Search

학습 목표

Hybrid Search의 alpha 파라미터 튜닝 방법을 이해한다 RRF(Reciprocal Rank Fusion)와 Score Fusion의 차이를 설명할 수 있다 제조 현장 쿼리 유형별 최적 가중치를 결정하는 기준을 안다

Hybrid Search 성능 튜닝

Alpha 파라미터란?

alpha는 BM25(키워드)와 Semantic(의미) 검색의 가중치 비율이다.

에디터 로딩 중...

제조 쿼리 유형별 최적 alpha

쿼리 유형예시최적 alpha이유
에러 코드E-4521, W-11050.2코드 정확 매칭 필요
규격/표준ISO 9001, KS B 12340.25표준 번호 정확 매칭
증상 설명진동이 심하고 온도 상승0.8의미 기반 검색 효과
절차 질의금형 교체 방법0.7개념적 유사성 중요
부품 조회베어링 7210C0.4이름+의미 혼합

RRF vs Score Fusion

Score Fusion: 점수를 직접 합산

에디터 로딩 중...

RRF (Reciprocal Rank Fusion): 순위 기반 합산

에디터 로딩 중...
비교Score FusionRRF
장점alpha로 세밀 조절파라미터 불필요
단점정규화 필수, alpha 튜닝점수 차이 반영 약함
적합쿼리 유형 예측 가능다양한 쿼리 처리

A/B 테스트로 alpha 최적화

에디터 로딩 중...

실무 팁: 제조 현장은 에러 코드/규격 번호 쿼리가 많으므로 alpha=0.3~0.4가 일반적으로 좋은 출발점이다.

핵심 포인트
  • alpha는 BM25와 Semantic 가중치 비율 — 에러코드 쿼리는 낮게(0.2), 증상 쿼리는 높게(0.8)
  • RRF는 파라미터 없이 안정적, Score Fusion은 alpha 튜닝으로 세밀 제어 가능
  • A/B 테스트로 실제 쿼리 데이터 기반 최적 alpha를 결정한다