40

센서 데이터 전처리: 이상치 & 결측치 처리

Day 2: 시계열 센서 데이터 처리

학습 목표

센서 데이터의 이상치를 탐지하고 처리할 수 있다 결측치 보간 전략을 상황에 맞게 선택할 수 있다 전처리 파이프라인을 구축할 수 있다

센서 데이터 전처리

산업 센서 데이터는 노이즈, 이상치, 결측치가 흔하다. 전처리 품질이 모델 성능의 80%를 결정한다.

이상치 원인

에디터 로딩 중...

핵심 구분

유형처리예시
센서 노이즈제거/보간순간 스파이크
실제 이상보존열화에 의한 점진적 변화

아래 코드를 preprocessing.py로 저장하고 실행하세요.

에디터 로딩 중...
힌트 보기
  • 시계열 이상치는 Rolling Window 방식이 가장 적합하다
  • IQR이나 Z-Score는 정적 분포를 가정하므로 추세가 있으면 오탐이 많다
  • 실제 이상(열화 신호)을 제거하지 않도록 주의한다
  • 결측 구간이 길면 보간보다 해당 구간 제거가 안전하다