30분
제조 문서는 다르다: 일반 문서와의 차이
Day 1: RAG 개요 & 제조 문서 이해
제조 문서는 다르다: 일반 문서와의 차이
RAG 기초 > Day 1: RAG 개요 & 제조 문서 이해
학습 목표
제조 문서의 고유한 특성을 파악한다 일반 문서와 제조 문서의 RAG 접근 차이를 이해한다 제조 문서 유형별 처리 전략을 학습한다
제조 문서는 왜 특별한가?
블로그 글이나 위키피디아에 RAG를 붙이는 것과 설비 매뉴얼에 RAG를 붙이는 것은 완전히 다른 문제다.
제조 문서의 5가지 특성
1. 구조가 엄격하다
에디터 로딩 중...
핵심: 섹션 번호, 버전, 승인 날짜, 관련 문서 참조가 있다. 이 구조를 무시하고 청킹하면 "절차 3.2"가 무엇을 말하는지 잃어버린다.
2. 도메인 용어가 독특하다
| 일반 용어 | 제조 용어 | 의미 |
|---|---|---|
| 오류 | 알람/폴트 | 설비 이상 신호 |
| 멈춤 | 비상정지/인터록 | 안전 연동 정지 |
| 설정 | 파라미터 | 수치 설정값 (#2012 등) |
| 순서 | SOP (표준작업절차) | 공인된 작업 절차 |
| 확인 | 인스펙션 | 품질 검사 |
| 마모 | 툴 라이프/마모량 | 공구 수명 |
"서보 앰프 CN1 커넥터 체결 불량으로 인한 E-001 알람"
일반 LLM은 이 문장의 맥락을 놓친다. RAG로 관련 매뉴얼을 제공하면 정확하게 이해한다.
3. 표와 수치가 핵심이다
에디터 로딩 중...
이 표를 일반 텍스트로 변환하면: "유압 프레스 HP-500 최대 가압력 500 ton 4903 kN 스트로크 350 mm..."
표 구조가 사라지면 "최대 가압력이 뭐야?"라는 질문에 "350 mm"를 답할 수 있다. 치명적 오류.
4. 다국어 혼용이 흔하다
에디터 로딩 중...
한 문단에 한글, 영어, 숫자, 기호가 섞여 있다. 임베딩 모델이 이를 제대로 처리하려면 다국어 모델이 필수다.
5. 버전 관리가 생명이다
에디터 로딩 중...
RAG 시스템에서 **메타데이터(버전, 날짜, 승인 상태)**는 선택이 아니라 필수다.
제조 문서 유형 정리
| 문서 유형 | 특징 | RAG 처리 전략 |
|---|---|---|
| 설비 매뉴얼 | 구조적, 표 많음, 다국어 | 섹션 기반 청킹, 표 보존 |
| SOP | 절차 중심, 번호 체계 | 절차 단위 청킹, 계층 보존 |
| 사양서 | 표/수치 중심 | 표 구조 유지, 수치 정확도 |
| 안전 규정 | 법적 구속력, 조항 참조 | 조항 단위 청킹, 교차 참조 |
| 품질 문서 | ISO 포맷, 버전 관리 | 버전 메타데이터 필수 |
| 트러블슈팅 가이드 | 증상-원인-해결 구조 | 사례 단위 청킹 |
다음 Task에서 이 문서들을 실제로 로드하고 분석해본다.