40분
제조 매뉴얼에서 학습 데이터 추출하는 5가지 전략
학습 데이터 준비
제조 매뉴얼에서 학습 데이터 추출하는 5가지 전략
QLoRA 파인튜닝 > 학습 데이터 준비
학습 목표
설비 매뉴얼에서 Q&A 데이터를 체계적으로 추출한다 데이터 소스별 추출 전략을 구분한다 카테고리별 데이터 분포 목표를 설정한다
제조 매뉴얼에서 학습 데이터 추출
전략 1: 에러 코드 테이블 -> Q&A 변환
에디터 로딩 중...
전략 2: SOP(표준작업절차서) -> 지시 데이터 변환
에디터 로딩 중...
전략 3: 품질 검사 기준 -> 판정 데이터 변환
에디터 로딩 중...
전략 4: 고장 이력 데이터 -> 진단 데이터 변환
에디터 로딩 중...
전략 5: GPT-4를 활용한 데이터 증강
에디터 로딩 중...
카테고리별 데이터 분포 목표
에디터 로딩 중...
핵심 포인트
- • 에러 코드 테이블: 가장 쉽게 변환 가능한 데이터 소스
- • SOP: 절차적 지식을 학습시키는 핵심 데이터
- • 고장 이력: 진단 능력을 키우는 고품질 데이터
- • GPT-4 증강: 시드 5건 -> 50건 확장 가능 (품질 검수 필수)
- • 목표: 최소 500건, 카테고리별 균형 분포