일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 42서울
- 인공지능
- Computer Vision
- 머신러닝
- 크롤러
- 42경산
- 피플
- 데이터분석
- 모델
- pytorch
- 자연어처리
- map
- Regression
- 유데미
- CV
- 플러터
- filtering
- 회귀
- 크롤링
- 지정헌혈
- 코딩애플
- 앱개발
- RNN
- mnist
- 딥러닝
- 선형회귀
- 파이썬
- 선형대수학
- AI
- Flutter
Archives
- Today
- Total
David의 개발 이야기!
[ R 공부 ] 피처엔지니어링(Feature Engineering) 이란 무엇일까? 본문
반응형
수집한 데이터 자체를 검토하는것에 집중하는 결측치 처리와 이상치 처리와는 달리, 피처엔지니어링(Feature Engineering)은 기존에 존재하는 변수를 활용해서 새로운 정보를 추가로 생성하는 과정을 말한다. 이 방식을 통해서, 새로운 데이터를 추가로 수집하는 것이 아니라, 현재 데이터를 활용한다는 점에서 주목할 필요가 있다.
피처엔지니어링에는
1. 변수의 단위를 변환하기 위한 스케일 조정방식
2. 연송형 변수를 범주형 변수로 범주형 변수를 연속형 변수로 변환
하는 방법이 있으며 그외에도
3. 특정 변수의 존재유무를 0과1로 표현하는 더미변수를 생성할 수도 있으며,
4. 주말, 평일로 구분하거나, 시간 데이터를 오전, 오후라는 새로운 변수를 추가해서 활용하는 방법
도 존재한다.
1. 새로운 파생 변수 생성하기
2. Table() 함수를 통해 살펴보기
반응형
'R 공부' 카테고리의 다른 글
[ R 공부 ] 지난 1년간의 카페 데이터 분석하기 실습 (0) | 2022.05.08 |
---|---|
[ R 공부 ] 데이터에서 이상치를 처리하려면 ? (0) | 2022.05.08 |
[ R 공부 ] 결측치 처리하기 (0) | 2022.05.08 |
Comments