40

제조 매뉴얼에서 학습 데이터 추출하는 5가지 전략

학습 데이터 준비

학습 목표

설비 매뉴얼에서 Q&A 데이터를 체계적으로 추출한다 데이터 소스별 추출 전략을 구분한다 카테고리별 데이터 분포 목표를 설정한다

제조 매뉴얼에서 학습 데이터 추출

전략 1: 에러 코드 테이블 -> Q&A 변환

에디터 로딩 중...

전략 2: SOP(표준작업절차서) -> 지시 데이터 변환

에디터 로딩 중...

전략 3: 품질 검사 기준 -> 판정 데이터 변환

에디터 로딩 중...

전략 4: 고장 이력 데이터 -> 진단 데이터 변환

에디터 로딩 중...

전략 5: GPT-4를 활용한 데이터 증강

에디터 로딩 중...

카테고리별 데이터 분포 목표

에디터 로딩 중...
핵심 포인트
  • 에러 코드 테이블: 가장 쉽게 변환 가능한 데이터 소스
  • SOP: 절차적 지식을 학습시키는 핵심 데이터
  • 고장 이력: 진단 능력을 키우는 고품질 데이터
  • GPT-4 증강: 시드 5건 -> 50건 확장 가능 (품질 검수 필수)
  • 목표: 최소 500건, 카테고리별 균형 분포