30

제조 문서는 다르다: 일반 문서와의 차이

Day 1: RAG 개요 & 제조 문서 이해

학습 목표

제조 문서의 고유한 특성을 파악한다 일반 문서와 제조 문서의 RAG 접근 차이를 이해한다 제조 문서 유형별 처리 전략을 학습한다

제조 문서는 왜 특별한가?

블로그 글이나 위키피디아에 RAG를 붙이는 것과 설비 매뉴얼에 RAG를 붙이는 것은 완전히 다른 문제다.


제조 문서의 5가지 특성

1. 구조가 엄격하다

에디터 로딩 중...

핵심: 섹션 번호, 버전, 승인 날짜, 관련 문서 참조가 있다. 이 구조를 무시하고 청킹하면 "절차 3.2"가 무엇을 말하는지 잃어버린다.


2. 도메인 용어가 독특하다

일반 용어제조 용어의미
오류알람/폴트설비 이상 신호
멈춤비상정지/인터록안전 연동 정지
설정파라미터수치 설정값 (#2012 등)
순서SOP (표준작업절차)공인된 작업 절차
확인인스펙션품질 검사
마모툴 라이프/마모량공구 수명

"서보 앰프 CN1 커넥터 체결 불량으로 인한 E-001 알람"

일반 LLM은 이 문장의 맥락을 놓친다. RAG로 관련 매뉴얼을 제공하면 정확하게 이해한다.


3. 표와 수치가 핵심이다

에디터 로딩 중...

이 표를 일반 텍스트로 변환하면: "유압 프레스 HP-500 최대 가압력 500 ton 4903 kN 스트로크 350 mm..."

표 구조가 사라지면 "최대 가압력이 뭐야?"라는 질문에 "350 mm"를 답할 수 있다. 치명적 오류.


4. 다국어 혼용이 흔하다

에디터 로딩 중...

한 문단에 한글, 영어, 숫자, 기호가 섞여 있다. 임베딩 모델이 이를 제대로 처리하려면 다국어 모델이 필수다.


5. 버전 관리가 생명이다

에디터 로딩 중...

RAG 시스템에서 **메타데이터(버전, 날짜, 승인 상태)**는 선택이 아니라 필수다.


제조 문서 유형 정리

문서 유형특징RAG 처리 전략
설비 매뉴얼구조적, 표 많음, 다국어섹션 기반 청킹, 표 보존
SOP절차 중심, 번호 체계절차 단위 청킹, 계층 보존
사양서표/수치 중심표 구조 유지, 수치 정확도
안전 규정법적 구속력, 조항 참조조항 단위 청킹, 교차 참조
품질 문서ISO 포맷, 버전 관리버전 메타데이터 필수
트러블슈팅 가이드증상-원인-해결 구조사례 단위 청킹

다음 Task에서 이 문서들을 실제로 로드하고 분석해본다.