30분

운영 배포 플레이북: 사내 데모에서 프로덕션까지

설비-공정 Knowledge Graph

학습 목표

PoC 데모와 프로덕션의 차이를 이해한다 Neo4j 백업/복구, 인증, 모니터링 체크리스트를 안다 사용자 온보딩 자료를 어떻게 만들지 계획한다

"이거 실제 공장에 깔 수 있어요?"

주간 프로젝트가 끝나면 받게 될 질문이다. 답은 "단계가 더 필요합니다".

PoC → 프로덕션 갭

항목	PoC (이번 주)	프로덕션
데이터	50개 노드 (수동 입력)	5,000+ 노드 (자동 ETL)
사용자	1명 (본인)	50~500명 (현장 엔지니어)
인증	비밀번호 1개 공유	SSO / RBAC
배포	localhost	사내 서버 / 클라우드
백업	없음	매일 자동 백업
모니터링	없음	쿼리 시간, 오류율, 사용량
LLM 비용	본인 카드	부서 청구 + 한도

1단계: 사내 데모 (다음 주)

목표: 정비팀 5명에게 보여주고 피드백 수집.

체크리스트:

Docker Compose로 일관된 환경 (Neo4j + Python + UI)
사용 시나리오 5개 사전 시연 영상 (1분짜리)
피드백 수집 양식 (Google Form)
알려진 한계 명시 ("이건 아직 안 됨" 리스트)

# docker-compose.yml 예시
version: '3.8'
services:
  neo4j:
    image: neo4j:5.20
    environment:
      - NEO4J_AUTH=neo4j/manufacturing2026
      - NEO4J_PLUGINS=["apoc"]
    ports:
      - "7474:7474"
      - "7687:7687"
    volumes:
      - neo4j_data:/data
      - ./setup:/var/lib/neo4j/import

  qa_app:
    build: .
    environment:
      - NEO4J_URI=bolt://neo4j:7687
      - OPENAI_API_KEY=${OPENAI_API_KEY}
    ports:
      - "8501:8501"
    depends_on:
      - neo4j

volumes:
  neo4j_data:

2단계: 부서 파일럿 (1~2개월)

목표: 1개 라인(설비 10~30대) 데이터로 30일간 실 사용.

준비물:

실제 정비 이력 데이터 ETL (CMMS → Neo4j)
사내 SSO 연동 (Active Directory, OAuth)
일일 자동 백업 (neo4j-admin database backup)
Prometheus + Grafana 대시보드 (쿼리 응답시간, 활성 사용자)
LLM 비용 한도 설정 (월 100만원 등)
인시던트 대응 절차 (Slack/Teams 알림)

# Neo4j 백업 (Cron으로 매일 실행)
0 2 * * * neo4j-admin database backup --to-path=/backups/neo4j-$(date +%Y%m%d) neo4j

# 30일 이상 된 백업 자동 삭제
0 3 * * * find /backups -name "neo4j-*" -mtime +30 -exec rm -rf {} \;

3단계: 전사 확산 (3개월~)

사용자 가이드 + 동영상 튜토리얼
슈퍼유저 프로그램 (각 부서별 1명, 피드백 채널)
A/B 테스트 인프라 (프롬프트 버전 비교)
ML 옵스: 골든 테스트 회귀 + 사용자 평점 모니터링
KG 데이터 거버넌스 (누가 노드 추가/수정? 승인 프로세스?)

운영의 적: "데이터가 곧 stale 해진다"

공장은 매일 변한다. 새 설비 도입, 부품 교체, 작업자 이동. KG가 현실과 어긋나기 시작하면 신뢰가 무너진다.

방지책:

자동 ETL: CMMS/ERP/MES에서 일일 동기화
사람 검증 큐: 자동 추출 결과를 정비팀이 주간 리뷰
만료 정책: 6개월 이상 된 노드는 "검증 필요" 표시
데이터 거버넌스 책임자: 1명 지정

사용자 온보딩 자료

1페이지 치트시트: "이렇게 물어보세요 vs 이렇게 묻지 마세요"
5분 데모 영상: 가장 흔한 5가지 질문 시연
FAQ: "답이 이상해요", "내 설비가 안 나와요" 대응
연락 채널: Slack 채널 + 담당자

핵심 정리

사내 데모: 환경 일관성(Docker), 시나리오 영상, 피드백 양식
부서 파일럿: SSO, 백업, 모니터링, 비용 한도, 인시던트 대응
전사 확산: 가이드, 슈퍼유저, A/B 테스트, ML 옵스, 거버넌스

이번 주 프로젝트는 "사내 데모 직전" 수준. 전사 확산까지 가려면 6개월~1년. 그 사이에 무엇을 더 해야 할지 다음 챕터에서 다룬다.

AI로 학습하기 — 꿀팁

🤖Neo4j 프로덕션 배포 체크리스트AI 학습 팁

AI에게 사내 PoC에서 프로덕션 Neo4j로 전환하는 단계별 배포 체크리스트를 생성하게 요청하세요.

제조 현장 사내망에 Neo4j 기반 KG Q&A 시스템을 PoC에서 프로덕션으로 전환하는 배포 플레이북 체크리스트를 만들어줘. 포함 항목: Neo4j 백업/복구 명령어, 인증(bolt+s, RBAC 설정), 모니터링(JVM 힙, 쿼리 지연), 롤백 절차, 보안 점검(포트 노출, 암호화). 각 항목에 구체적인 명령어나 설정 예시를 포함해줘.

이 팁이 도움이 됐나요?

핵심 포인트

• PoC와 프로덕션은 데이터 규모, 인증, 백업, 모니터링 모두 다름
• Docker Compose로 사내 데모 환경의 일관성 확보
• 프로덕션은 SSO, 일일 백업, Prometheus 모니터링, LLM 비용 한도 필수
• 데이터가 stale 해지면 KG 신뢰가 무너짐 — 자동 ETL + 사람 검증 큐 필요

이전 다음

이 콘텐츠에 오류가 있나요? 신고하기