David의 개발 이야기!

[ R 공부 ] 피처엔지니어링(Feature Engineering) 이란 무엇일까? 본문

R 공부

[ R 공부 ] 피처엔지니어링(Feature Engineering) 이란 무엇일까?

david.kim2028 2022. 5. 8. 15:50
반응형

수집한 데이터 자체를 검토하는것에 집중하는 결측치 처리와 이상치 처리와는 달리, 피처엔지니어링(Feature Engineering)은 기존에 존재하는 변수를 활용해서 새로운 정보를 추가로 생성하는 과정을 말한다. 이 방식을 통해서, 새로운 데이터를 추가로 수집하는 것이 아니라, 현재 데이터를 활용한다는 점에서 주목할 필요가 있다. 

 

피처엔지니어링에는 

 

1. 변수의 단위를 변환하기 위한 스케일 조정방식

2. 연송형 변수를 범주형 변수로 범주형 변수를 연속형 변수로 변환

 

하는 방법이 있으며 그외에도

 

3. 특정 변수의 존재유무를 0과1로 표현하는 더미변수를 생성할 수도 있으며,

4. 주말, 평일로 구분하거나, 시간 데이터를 오전, 오후라는 새로운 변수를 추가해서 활용하는 방법

 

도 존재한다. 

 

1. 새로운 파생 변수 생성하기 

 

2. Table() 함수를 통해 살펴보기 

반응형
Comments