25

Hybrid Search, 이렇게 하면 망한다

Day 2: Hybrid Search

학습 목표

Hybrid Search 구현 시 자주 발생하는 실수를 파악한다 각 실수에 대한 해결책을 설명할 수 있다

Hybrid Search, 이렇게 하면 망한다


실수 1: 점수 정규화를 안 한다

에디터 로딩 중...

해결: Min-Max 정규화

에디터 로딩 중...

실수 2: alpha를 고정한다

에디터 로딩 중...

해결: 쿼리 유형별 적응형 alpha

에디터 로딩 중...

실수 3: 토크나이징 불일치

에디터 로딩 중...

해결: 동일한 토크나이저 사용

에디터 로딩 중...

실수 4: 검색 후보 수가 부족

에디터 로딩 중...

해결: initial_k를 final_k의 4~10배로

에디터 로딩 중...

실수 5: 메타데이터 필터를 안 쓴다

에디터 로딩 중...

해결: 사전 필터링

에디터 로딩 중...

Score Fusion vs RRF: 언제 뭘 쓸까?

기준Score FusionRRF
장점alpha로 세밀 조절 가능파라미터 최적화 불필요
단점정규화 필수, alpha 튜닝점수 차이 반영 약함
적합쿼리 유형이 예측 가능할 때다양한 쿼리가 올 때
제조 추천적응형 alpha와 함께빠른 프로토타이핑

체크리스트

  • 점수 정규화 (Min-Max) 적용
  • 쿼리 유형별 적응형 alpha 설정
  • 인덱싱과 검색에 동일 토크나이저 사용
  • initial_k를 final_k의 4배 이상으로 설정
  • 메타데이터 필터 활용 (장비 코드, 문서 유형)