30분
피처 중요도 분석: Random Forest Importance
Day 2: 시계열 센서 데이터 처리
피처 중요도 분석: Random Forest Importance
예지보전 — 설비 고장 예측 시스템 > Day 2: 시계열 센서 데이터 처리
학습 목표
Random Forest로 피처 중요도를 평가할 수 있다 불필요한 피처를 식별하고 제거할 수 있다 피처 선택이 모델 성능에 미치는 영향을 확인할 수 있다
피처 중요도 분석
센서 21개 x 피처 9개 = 189개 피처. 모두 다 쓰면 과적합 위험이 있다. 중요한 피처만 골라서 사용한다.
피처 선택 방법
에디터 로딩 중...
아래 코드를 feature_importance.py로 저장하고 실행하세요.
에디터 로딩 중...
힌트 보기
- • Random Forest importance는 비선형 관계도 포착한다
- • 피처를 줄여도 성능이 유지되면 과적합이 줄어든 것이다
- • 상위 10~15개 피처로 충분한 경우가 많다
- • Permutation Importance는 더 신뢰할 수 있지만 느리다