25분
Knowledge Graph vs Vector DB: 제조 데이터에 어느 것을 써야 하나
제조 온톨로지 설계
Knowledge Graph vs Vector DB: 제조 데이터에 어느 것을 써야 하나
온톨로지 & Knowledge Graph > 제조 온톨로지 설계
학습 목표
Knowledge Graph와 Vector DB의 차이를 정확히 설명할 수 있다 제조 데이터 유형별로 적절한 저장소를 선택할 수 있다 두 기술을 결합하는 Hybrid Retrieval 전략을 이해한다
"우리 공장에는 어떤 DB를 써야 하나요?"
제조 현장에서 LLM을 도입하면 가장 먼저 부딪히는 질문이다. Vector DB? Knowledge Graph? 아니면 둘 다?
결론부터 말하면 답은 데이터의 성격에 달려있다.
한 줄 요약
| 저장소 | 가장 잘하는 것 | 못하는 것 |
|---|---|---|
| Vector DB | 의미 유사도 검색 ("비슷한 문서 찾기") | 정확한 관계 추론 |
| Knowledge Graph | 관계 기반 추론 ("A 때문에 B가 망가졌어") | 비정형 텍스트 검색 |
| Hybrid | 둘의 장점을 결합 | 구현 복잡도 증가 |
Vector DB가 잘하는 것
에디터 로딩 중...
장점
- 단어가 정확히 일치하지 않아도 "의미"로 검색 ("떨림" ≈ "진동" ≈ "채터링")
- 비정형 매뉴얼/보고서/이메일에 강함
- 도입이 빠름 (수 시간 내 PoC)
단점
- "3호기에서 어제 발생한 알람의 원인이 무엇인가?" 같은 구조화된 질문은 약함
- 관계 추적 불가 ("이 알람과 연관된 부품은?" → 직접 답 못함)
- 환각(Hallucination) 위험: 비슷한 문서를 가져와도 LLM이 잘못 조합할 수 있음
Knowledge Graph가 잘하는 것
에디터 로딩 중...
장점
- 정확한 관계 추론 (홉이 여러 개여도 정확)
- 설명 가능 (Why? 질문에 경로로 답변 가능)
- 사실 검증: KG에 없는 정보는 "모른다"고 명시 가능 → 환각 방지
단점
- 스키마 설계가 어려움 (도메인 전문가 협업 필수)
- 데이터 입력 비용 (ETL/스크래핑/수동 입력)
- 자연어 매뉴얼 검색은 약함
제조 데이터 유형별 가이드
| 데이터 유형 | 추천 저장소 | 이유 |
|---|---|---|
| 설비 매뉴얼 PDF (수백 페이지) | Vector DB | 비정형 텍스트, 의미 검색이 핵심 |
| 설비-부품-고장 관계 | Knowledge Graph | 구조화된 관계 추론 |
| 정비 이력 로그 (정형) | Knowledge Graph | 시간 + 작업자 + 부품 관계 |
| 안전 보고서/사고 사례 | Hybrid | 텍스트(Vector) + 인과 관계(KG) |
| 도면/사양서 | Vector DB + 메타데이터 | 시각 자료 임베딩 + 분류 |
| 작업자 스킬-자격증 | Knowledge Graph | "~할 수 있는 사람" 쿼리 |
Hybrid Retrieval: 둘 다 쓰는 패턴
실무에서는 Vector DB + Knowledge Graph 결합이 최강이다.
에디터 로딩 중...
효과: 환각 80% 감소, 답변 신뢰도 2배 향상 (자체 측정 기준).
결론: 우리 공장은?
에디터 로딩 중...
이번 주에 만들 시스템은 KG 우선 + Vector 보조 패턴이다. 관계 기반 진단이 제조 현장의 70% 이슈를 커버하기 때문이다.
핵심 포인트
- • Vector DB는 비정형 텍스트의 의미 유사도 검색에 강함
- • Knowledge Graph는 정형 관계 기반 추론과 환각 방지에 강함
- • Hybrid는 두 기술의 장점을 결합하여 실무 정확도를 극대화
- • 제조 현장 70% 이슈는 관계 기반 진단으로 해결 가능