30분
Hybrid Retrieval 심화: Vector + Graph + Keyword 3-way 통합
GraphRAG 통합
Hybrid Retrieval 심화: Vector + Graph + Keyword 3-way 통합
온톨로지 & Knowledge Graph > GraphRAG 통합
학습 목표
Vector/Graph/Keyword 검색의 강점을 비교한다 Reranking과 Score Fusion 기법을 이해한다 제조 도메인의 실전 하이브리드 아키텍처를 설계할 수 있다
한 가지 검색 방식만으로는 부족하다
실무에서 만나는 질문은 다양하다. 각 질문 유형에 가장 잘 맞는 검색 방식이 다르다.
에디터 로딩 중...
3가지를 다 쓰는 것이 Hybrid Retrieval.
3-way 통합 아키텍처
에디터 로딩 중...
Score Fusion 기법
다른 검색 방식의 점수를 어떻게 결합할까?
방법 1: Reciprocal Rank Fusion (RRF)
에디터 로딩 중...
장점: 점수 스케일이 달라도 작동, 구현 간단.
방법 2: Weighted Fusion
에디터 로딩 중...
장점: 도메인 지식 반영 가능 (제조에서는 Graph 비중을 높임).
Reranking: 최종 순위 결정
Fusion 후에도 상위 N개 후보가 남는다. Cross-Encoder가 마지막 정렬.
에디터 로딩 중...
효과: 검색 정확도 10~30% 향상 (벤치마크 기준).
Query Router의 역할
질문 유형을 미리 분류하여 적절한 검색기에만 호출.
에디터 로딩 중...
제조 도메인 권장 가중치
경험적으로 다음 비율이 잘 작동한다:
| 질문 유형 | Vector | Graph | Keyword |
|---|---|---|---|
| 진단/원인 추적 | 0.2 | 0.6 | 0.2 |
| 매뉴얼 검색 | 0.6 | 0.1 | 0.3 |
| 부품/코드 조회 | 0.1 | 0.2 | 0.7 |
| 일반 Q&A | 0.4 | 0.3 | 0.3 |
핵심 정리
에디터 로딩 중...
이번 주는 Graph 위주, Week 8에서 Vector 결합 + Reranker를 추가한다.
핵심 포인트
- • Hybrid Retrieval = Vector(의미) + Graph(관계) + Keyword(정확)
- • RRF는 점수 스케일 차이를 흡수하는 가장 견고한 fusion 기법
- • Cross-Encoder Reranker로 정확도 10~30% 추가 향상 가능
- • 제조 진단 질문에서는 Graph 가중치가 가장 높아야 함