30분
운영 배포 플레이북: 사내 데모에서 프로덕션까지
설비-공정 Knowledge Graph
운영 배포 플레이북: 사내 데모에서 프로덕션까지
온톨로지 & Knowledge Graph > 설비-공정 Knowledge Graph
학습 목표
PoC 데모와 프로덕션의 차이를 이해한다 Neo4j 백업/복구, 인증, 모니터링 체크리스트를 안다 사용자 온보딩 자료를 어떻게 만들지 계획한다
"이거 실제 공장에 깔 수 있어요?"
주간 프로젝트가 끝나면 받게 될 질문이다. 답은 "단계가 더 필요합니다".
PoC → 프로덕션 갭
| 항목 | PoC (이번 주) | 프로덕션 |
|---|---|---|
| 데이터 | 50개 노드 (수동 입력) | 5,000+ 노드 (자동 ETL) |
| 사용자 | 1명 (본인) | 50~500명 (현장 엔지니어) |
| 인증 | 비밀번호 1개 공유 | SSO / RBAC |
| 배포 | localhost | 사내 서버 / 클라우드 |
| 백업 | 없음 | 매일 자동 백업 |
| 모니터링 | 없음 | 쿼리 시간, 오류율, 사용량 |
| LLM 비용 | 본인 카드 | 부서 청구 + 한도 |
1단계: 사내 데모 (다음 주)
목표: 정비팀 5명에게 보여주고 피드백 수집.
체크리스트:
- Docker Compose로 일관된 환경 (Neo4j + Python + UI)
- 사용 시나리오 5개 사전 시연 영상 (1분짜리)
- 피드백 수집 양식 (Google Form)
- 알려진 한계 명시 ("이건 아직 안 됨" 리스트)
에디터 로딩 중...
2단계: 부서 파일럿 (1~2개월)
목표: 1개 라인(설비 10~30대) 데이터로 30일간 실 사용.
준비물:
- 실제 정비 이력 데이터 ETL (CMMS → Neo4j)
- 사내 SSO 연동 (Active Directory, OAuth)
- 일일 자동 백업 (
neo4j-admin database backup) - Prometheus + Grafana 대시보드 (쿼리 응답시간, 활성 사용자)
- LLM 비용 한도 설정 (월 100만원 등)
- 인시던트 대응 절차 (Slack/Teams 알림)
에디터 로딩 중...
3단계: 전사 확산 (3개월~)
- 사용자 가이드 + 동영상 튜토리얼
- 슈퍼유저 프로그램 (각 부서별 1명, 피드백 채널)
- A/B 테스트 인프라 (프롬프트 버전 비교)
- ML 옵스: 골든 테스트 회귀 + 사용자 평점 모니터링
- KG 데이터 거버넌스 (누가 노드 추가/수정? 승인 프로세스?)
운영의 적: "데이터가 곧 stale 해진다"
공장은 매일 변한다. 새 설비 도입, 부품 교체, 작업자 이동. KG가 현실과 어긋나기 시작하면 신뢰가 무너진다.
방지책:
- 자동 ETL: CMMS/ERP/MES에서 일일 동기화
- 사람 검증 큐: 자동 추출 결과를 정비팀이 주간 리뷰
- 만료 정책: 6개월 이상 된 노드는 "검증 필요" 표시
- 데이터 거버넌스 책임자: 1명 지정
사용자 온보딩 자료
- 1페이지 치트시트: "이렇게 물어보세요 vs 이렇게 묻지 마세요"
- 5분 데모 영상: 가장 흔한 5가지 질문 시연
- FAQ: "답이 이상해요", "내 설비가 안 나와요" 대응
- 연락 채널: Slack 채널 + 담당자
핵심 정리
에디터 로딩 중...
이번 주 프로젝트는 "사내 데모 직전" 수준. 전사 확산까지 가려면 6개월~1년. 그 사이에 무엇을 더 해야 할지 다음 챕터에서 다룬다.
핵심 포인트
- • PoC와 프로덕션은 데이터 규모, 인증, 백업, 모니터링 모두 다름
- • Docker Compose로 사내 데모 환경의 일관성 확보
- • 프로덕션은 SSO, 일일 백업, Prometheus 모니터링, LLM 비용 한도 필수
- • 데이터가 stale 해지면 KG 신뢰가 무너짐 — 자동 ETL + 사람 검증 큐 필요