일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 딥러닝
- map
- Computer Vision
- Flutter
- 선형회귀
- 코딩애플
- 유데미
- 자연어처리
- 42경산
- CV
- 회귀
- 지정헌혈
- 인공지능
- AI
- 피플
- mnist
- 앱개발
- Regression
- 플러터
- RNN
- 크롤링
- 모델
- 데이터분석
- 42서울
- 크롤러
- 선형대수학
- 머신러닝
- filtering
- pytorch
- 파이썬
Archives
- Today
- Total
David의 개발 이야기!
[ R 공부 ] 결측치 처리하기 본문
반응형
1. 결측치 확인하기
R에서는 결측치를 NA(Not Available)로 표현하고 있으며, 결측치가 있을 경우 연산 결과가 NA로 표현됨.
문자형변수는 <NA> 로,
숫자형 변수는 NA 로 표현됨.
- 결측치를 확인하기 위해 is.na() 함수를 이용!
- Table() 함수를 이용하여, 결측치의 개수를 파악할 수 있음!
- 일반적으로 함수를 사용할떄, 결측치가 포함된 변수는 연산을 하기 어려움
- 연산 결과가 NA로 출력되기 때문에 결측치를 처리한 후 작업하는 것이 일반적임
- na.rm =TRUE 를 통해 결측치 제거
2. 결측치 제거하기
1. is.na(sample) 을 하면, NA가 있으면 TRUE로 반환, 없으면 FALSE 로 나옴
2. !is.na(sample)을 하면, 위에거에서 TRUE, FALSE 만 반대로 나옴
3. 이 값을 sample[ , ] 에 넣어주면 TRUE에 해당하는 것만 나옴.
4. id에 해당하는 FALSE만 지워주고(NA값을 지워주고) , math에 해당하는 건 아래에서 지워주면 끝.
< R 에서 기본적으로 제공하는 na.omit() 함수를 이용하면 결측치가 발생한 전체 행을 제할 수 있음!! >
3. 결측치 대체하기
- na.rm=TRUE를 통해서 결측치를 제외하고, 평균을 구한다음에 전체 평균을 NA값에 넣어주었음.
반응형
'R 공부' 카테고리의 다른 글
[ R 공부 ] 지난 1년간의 카페 데이터 분석하기 실습 (0) | 2022.05.08 |
---|---|
[ R 공부 ] 피처엔지니어링(Feature Engineering) 이란 무엇일까? (0) | 2022.05.08 |
[ R 공부 ] 데이터에서 이상치를 처리하려면 ? (0) | 2022.05.08 |
Comments