일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 선형대수학
- 자연어처리
- AI
- 42경산
- 유데미
- 데이터분석
- 머신러닝
- CV
- 지정헌혈
- 크롤러
- map
- 크롤링
- pytorch
- 플러터
- 회귀
- RNN
- Regression
- 42서울
- 코딩애플
- 인공지능
- 모델
- 피플
- 선형회귀
- Computer Vision
- mnist
- filtering
- 딥러닝
- 파이썬
- 앱개발
- Flutter
- Today
- Total
David의 개발 이야기!
[ R 공부 ] 지난 1년간의 카페 데이터 분석하기 실습 본문
카페의 매출 데이터를 이용하여 데이터 분석을 수행하고자함.
데이터는 아래와 같음.
1. readxl 패키지를 이용하여 엑셀 데이터 분석하기
- 데이터 불러오기
- 결측치 유무 확인하기
-> order_date 에서 발견된 결측치로는 언제 주문했는지를 알 수 없으므로 제가해야함.
- 이상치 확인하기
- nrow() 함수를 이용해서 sales 데이터 행수를 확인해보면 62581 데이터 발생
- 이때 발생한 건 중에서 주문한 건수를 찾으려면 중복되지 않은 주문 ID를 세즌 unique() 함수와 length() 함수를 이용.
2. 카페에서 가장 많이 판매한 메뉴 확인하기
- 카페 메뉴 판매건수 확인하기
- 가장 많이 팔린 것부터 보이도록 정렬
-> 내림차순 : decreasing=TRUE
- 카페 메뉴 판매 매출액 확인하기
1. table() 과 data.frame() 함수를 이용해서 음료 판매건수를 구한 데이터를 구성
2. 새롭게 생성한 데이터를 sales_tr에 넣어주고 , head() 함수를 이용해서 일부데이터만 확인
3. sales_tr 의 Var1 열은 sales의 item 과 같은 값이고 Freq 열은 메뉴가 판매된 건수
4. 음료 판매가 데이터를 만들기 위해 원본데이터 와 subset.data.frame() 함수를 이용하여 카페에서 판매하는 음료와 판매가를 추출
음료와 판매가를 추출한 후 살펴보면 같은 음료와 같은 가격이 반복적으로 나나는 것을 확인할 수 있다.
5. unique() 함수를 이용해서 중복된 정보를 한번 만 나타나도록 처리
6.
매출액을 계산하기 위해 sales_tr 데이터와 sales_item 의 price 열을 곱하면 매출액이 나와야함
매출액 계산식 대로, sales_tr$Freq * sales_item$price 를 수행하면 결과가 나옴
다만, sales_tr의 첫번째 행은 깔라만시의 판매건수이고, sales_item의 첫번째 행은 카라멜마끼아또의 판매가 이어서 잘못된 결과가 나옴
7. 정상적인 계산을 위해서 두데이터를 하나의 데이터로 병합해야함
두 데이터를 하나의 데이터로 합치기 위해 merge() 함수 사용
8. 메뉴별로 판매한 금액이 얼마나 되는지 확인하기
'R 공부' 카테고리의 다른 글
[ R 공부 ] 피처엔지니어링(Feature Engineering) 이란 무엇일까? (0) | 2022.05.08 |
---|---|
[ R 공부 ] 데이터에서 이상치를 처리하려면 ? (0) | 2022.05.08 |
[ R 공부 ] 결측치 처리하기 (0) | 2022.05.08 |