30

Hybrid Retrieval 심화: Vector + Graph + Keyword 3-way 통합

GraphRAG 통합

학습 목표

Vector/Graph/Keyword 검색의 강점을 비교한다 Reranking과 Score Fusion 기법을 이해한다 제조 도메인의 실전 하이브리드 아키텍처를 설계할 수 있다

한 가지 검색 방식만으로는 부족하다

실무에서 만나는 질문은 다양하다. 각 질문 유형에 가장 잘 맞는 검색 방식이 다르다.

에디터 로딩 중...

3가지를 다 쓰는 것이 Hybrid Retrieval.


3-way 통합 아키텍처

에디터 로딩 중...

Score Fusion 기법

다른 검색 방식의 점수를 어떻게 결합할까?

방법 1: Reciprocal Rank Fusion (RRF)

에디터 로딩 중...

장점: 점수 스케일이 달라도 작동, 구현 간단.

방법 2: Weighted Fusion

에디터 로딩 중...

장점: 도메인 지식 반영 가능 (제조에서는 Graph 비중을 높임).


Reranking: 최종 순위 결정

Fusion 후에도 상위 N개 후보가 남는다. Cross-Encoder가 마지막 정렬.

에디터 로딩 중...

효과: 검색 정확도 10~30% 향상 (벤치마크 기준).


Query Router의 역할

질문 유형을 미리 분류하여 적절한 검색기에만 호출.

에디터 로딩 중...

제조 도메인 권장 가중치

경험적으로 다음 비율이 잘 작동한다:

질문 유형VectorGraphKeyword
진단/원인 추적0.20.60.2
매뉴얼 검색0.60.10.3
부품/코드 조회0.10.20.7
일반 Q&A0.40.30.3

핵심 정리

에디터 로딩 중...

이번 주는 Graph 위주, Week 8에서 Vector 결합 + Reranker를 추가한다.

핵심 포인트
  • Hybrid Retrieval = Vector(의미) + Graph(관계) + Keyword(정확)
  • RRF는 점수 스케일 차이를 흡수하는 가장 견고한 fusion 기법
  • Cross-Encoder Reranker로 정확도 10~30% 추가 향상 가능
  • 제조 진단 질문에서는 Graph 가중치가 가장 높아야 함