25

Knowledge Graph vs Vector DB: 제조 데이터에 어느 것을 써야 하나

제조 온톨로지 설계

학습 목표

Knowledge Graph와 Vector DB의 차이를 정확히 설명할 수 있다 제조 데이터 유형별로 적절한 저장소를 선택할 수 있다 두 기술을 결합하는 Hybrid Retrieval 전략을 이해한다

"우리 공장에는 어떤 DB를 써야 하나요?"

제조 현장에서 LLM을 도입하면 가장 먼저 부딪히는 질문이다. Vector DB? Knowledge Graph? 아니면 둘 다?

결론부터 말하면 답은 데이터의 성격에 달려있다.


한 줄 요약

저장소가장 잘하는 것못하는 것
Vector DB의미 유사도 검색 ("비슷한 문서 찾기")정확한 관계 추론
Knowledge Graph관계 기반 추론 ("A 때문에 B가 망가졌어")비정형 텍스트 검색
Hybrid둘의 장점을 결합구현 복잡도 증가

Vector DB가 잘하는 것

에디터 로딩 중...

장점

  • 단어가 정확히 일치하지 않아도 "의미"로 검색 ("떨림" ≈ "진동" ≈ "채터링")
  • 비정형 매뉴얼/보고서/이메일에 강함
  • 도입이 빠름 (수 시간 내 PoC)

단점

  • "3호기에서 어제 발생한 알람의 원인이 무엇인가?" 같은 구조화된 질문은 약함
  • 관계 추적 불가 ("이 알람과 연관된 부품은?" → 직접 답 못함)
  • 환각(Hallucination) 위험: 비슷한 문서를 가져와도 LLM이 잘못 조합할 수 있음

Knowledge Graph가 잘하는 것

에디터 로딩 중...

장점

  • 정확한 관계 추론 (홉이 여러 개여도 정확)
  • 설명 가능 (Why? 질문에 경로로 답변 가능)
  • 사실 검증: KG에 없는 정보는 "모른다"고 명시 가능 → 환각 방지

단점

  • 스키마 설계가 어려움 (도메인 전문가 협업 필수)
  • 데이터 입력 비용 (ETL/스크래핑/수동 입력)
  • 자연어 매뉴얼 검색은 약함

제조 데이터 유형별 가이드

데이터 유형추천 저장소이유
설비 매뉴얼 PDF (수백 페이지)Vector DB비정형 텍스트, 의미 검색이 핵심
설비-부품-고장 관계Knowledge Graph구조화된 관계 추론
정비 이력 로그 (정형)Knowledge Graph시간 + 작업자 + 부품 관계
안전 보고서/사고 사례Hybrid텍스트(Vector) + 인과 관계(KG)
도면/사양서Vector DB + 메타데이터시각 자료 임베딩 + 분류
작업자 스킬-자격증Knowledge Graph"~할 수 있는 사람" 쿼리

Hybrid Retrieval: 둘 다 쓰는 패턴

실무에서는 Vector DB + Knowledge Graph 결합이 최강이다.

에디터 로딩 중...

효과: 환각 80% 감소, 답변 신뢰도 2배 향상 (자체 측정 기준).


결론: 우리 공장은?

에디터 로딩 중...

이번 주에 만들 시스템은 KG 우선 + Vector 보조 패턴이다. 관계 기반 진단이 제조 현장의 70% 이슈를 커버하기 때문이다.

핵심 포인트
  • Vector DB는 비정형 텍스트의 의미 유사도 검색에 강함
  • Knowledge Graph는 정형 관계 기반 추론과 환각 방지에 강함
  • Hybrid는 두 기술의 장점을 결합하여 실무 정확도를 극대화
  • 제조 현장 70% 이슈는 관계 기반 진단으로 해결 가능