불균형 데이터 처리: SMOTE & Class Weights | 예지보전 — 설비 고장 예측 시스템 | AX Academy

클래스 불균형 문제

설비는 대부분 정상이고, 고장은 드물다.

에디터 로딩 중...

소수 클래스의 손실에 가중치를 더 부여한다.

에디터 로딩 중...

장점	단점
구현 간단	최적 가중치 탐색 필요
원본 데이터 유지	과적합 가능

소수 클래스의 합성 샘플을 생성한다.

에디터 로딩 중...

장점	단점
정보 손실 없음	과적합 위험 (시계열 주의)
소수 클래스 보강	합성 데이터 품질

다수 클래스에서 일부만 사용한다.

에디터 로딩 중...

장점	단점
빠른 학습	정보 손실
균형 잡힌 데이터	다수 클래스 패턴 놓침

핵심: 시계열 데이터에 SMOTE를 적용할 때는 시간 순서를 무시하지 않도록 피처 레벨에서 적용한다. 원시 시퀀스에 직접 SMOTE를 쓰면 비현실적인 패턴이 생긴다.