30

피처 중요도 분석: Random Forest Importance

Day 2: 시계열 센서 데이터 처리

학습 목표

Random Forest로 피처 중요도를 평가할 수 있다 불필요한 피처를 식별하고 제거할 수 있다 피처 선택이 모델 성능에 미치는 영향을 확인할 수 있다

피처 중요도 분석

센서 21개 x 피처 9개 = 189개 피처. 모두 다 쓰면 과적합 위험이 있다. 중요한 피처만 골라서 사용한다.

피처 선택 방법

에디터 로딩 중...

아래 코드를 feature_importance.py로 저장하고 실행하세요.

에디터 로딩 중...
힌트 보기
  • Random Forest importance는 비선형 관계도 포착한다
  • 피처를 줄여도 성능이 유지되면 과적합이 줄어든 것이다
  • 상위 10~15개 피처로 충분한 경우가 많다
  • Permutation Importance는 더 신뢰할 수 있지만 느리다