일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 선형회귀
- filtering
- 지정헌혈
- pytorch
- 코딩애플
- 유데미
- RNN
- 회귀
- Flutter
- Computer Vision
- 피플
- map
- 선형대수학
- 모델
- 크롤링
- Regression
- mnist
- CV
- 데이터분석
- 파이썬
- AI
- 자연어처리
- 머신러닝
- 크롤러
- 앱개발
- 42서울
- 딥러닝
- 42경산
- 인공지능
- 플러터
- Today
- Total
목록분류 전체보기 (110)
David의 개발 이야기!

연차에 따라 올라가는 임금을 알아보는 모델을 만들어보자! 1. Importing the libraries import numpy as np import pandas as pd import matplotlib.pyplot as plt 2. Importing the dataset dataset = pd.read_csv("Position_Salaries.csv") x = dataset.iloc[:,1:-1].values y = dataset.iloc[:,-1].values 3. Training the Polynomial Regression model on the whole dataset from sklearn.preprocessing import PolynomialFeatures poly_reg = Polyn..

Multiple Linear Regression 다중선형회귀모형에 대해 알아보고, 스타트업 수익조건 을 만들어보자! 1. Importing the libraries 2. Importing the dataset 3. Encoding the categorical data 4. Splitting thd dataset into the Training set and Test set 5. Training the Multiple Linear Regression model on the Training set 6. Predicting the Test set results 1. Importing the libraries import numpy as np import pandas as pd import matplotlib ..

Simple Linear Regression 단순회귀를 적용하는 방법을 알아보고, 연차별 임금 예측 모형을 만들어보자! 1. 라이브러리 호출하기 Importing the libraries 2. 데이터셋 불러오기 Importing the dataset 3. 훈련세트와 테스트 세트로 나누기 Splitting the dataset into the Training set and Test set 4. 단순선형회귀모델에 학습시키기 Training the Simple Linear Regression model on the Training Set 5. 테스트 세트 결과 예측하기 Predicting the Test set results 6. 결과 시각화하기 Visualizing the Training set and th..
fit() -> "훈련해라", "머신러닝이 데이터에 머신러닝 모델을 맞추는 것(fit)" 학습데이터 세트에서 변환을 위한 기반 설정을 하는 함수이다! 데이터를 학습시키는 메서드라고 생각하면 된다. transform() -> fit 을 기준으로 얻은 mean, variance에 맞춰서 변형하는것! 1. fit을 통해 세운 기반으로 변형하는 함수! 2. 실제로 학습시킨 것을 적용하는 메서드라고 생각하면 된다! fit_transform() 이건 그냥 두개 합쳐 놓은 것이라 생각하면 됨! 그렇다면 왜 train dataset에서만 fit_transform 혹은 fit, transform을 할까? from sklearn.preprocessing import StandardScaler sc = StandardSca..
데이터 전처리 과정을 살펴보면, 1. 라이브러리를 불러온다. Importing the libraries 2. 데이터셋을 불러온다. Importing the dataset 3. 결측치를 어떻게 처리할 것인가? Taking care of missing data 4. 범주형 데이터를 처리해준다! Encoding the categorical data 5. 훈련데이터와 테스트데이터를 나눠준다 Spliting the dataset into the Training set and Test set 6. 표준화, 정규화를 해준다 Feature scaling 이렇게 해주어야한다. 각각에 해당하는 코드를 살펴보자. 1. Importing the libraries import numpy as np import pandas as..

1. 카이제곱이 필요한 이유! 범주의 숫자가 많아지면 그래프가 낮아지는 특성이 있음. 2. 일원 카이제곱 검정 3. 이원 카이제곱 검정 만약에 연속형변수 였다면, 피어슨 상관계수 등을 통해서 확인할 수 있으나, 카이제곱을 하는 이유는 모두 명목형 변수이기 때문이다. 카이제곱 분포는 인과관계가 아님! 연관성이 있는지 없는지 확인하는 것이다!!!!!! 12.25 = 25 X 98 / 200 12.75 = 25 X 102 /200 85.75 = 175 X 98 / 200 89.25. = 175 X 102 / 200 4. 카이제곱의 한계 5. 알아두면 좋은 개념들 5-1 상대위험도 5-2 교차비/오즈비 ( Odds ratio ) *(오타) BC가 발생할 오즈는 핸드폰 사용자가 그렇지 않은 사람보다 3배 높음 5..