일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- filtering
- 42경산
- mnist
- 42서울
- 파이썬
- 유데미
- map
- 모델
- 자연어처리
- 앱개발
- 선형대수학
- 플러터
- 데이터분석
- RNN
- Computer Vision
- 딥러닝
- 회귀
- 피플
- 지정헌혈
- pytorch
- CV
- 코딩애플
- Flutter
- 크롤러
- 머신러닝
- AI
- 크롤링
- 인공지능
- Regression
- 선형회귀
Archives
- Today
- Total
David의 개발 이야기!
[ 파트2 섹션7 ] Multiple Linear Regression 다중선형회귀에 대해 알아보자! 본문
Udemy Python Machine Learning A-Z
[ 파트2 섹션7 ] Multiple Linear Regression 다중선형회귀에 대해 알아보자!
david.kim2028 2022. 9. 11. 22:39반응형
Multiple Linear Regression
다중선형회귀모형에 대해 알아보고, 스타트업 수익조건 을 만들어보자!
1. Importing the libraries
2. Importing the dataset
3. Encoding the categorical data
4. Splitting thd dataset into the Training set and Test set
5. Training the Multiple Linear Regression model on the Training set
6. Predicting the Test set results
1. Importing the libraries
import numpy as np
import pandas as pd
import matplotlib as plt
2. Importing the dataset
dataset = pd.read_csv("----")
dataset.iloc[:,:-1].values
dataset.iloc[:,-1].values
3. Encoding the categorical data
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(),[3])], remainder='passthrough')
x = np.array(ct.fit_transform(x))
4. Splitting the dataset into the Training set and Test set
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=1)
5. Training the Multiple Linear Regression model on the Training set
from sklearn.linearr_model import LinearRegression
regressor = LinearRegression()
regressor.fit(x_train, y_train)
regressor.fit 으로 훈련데이터로 모델 학습!
6. Predicting the Test set results
y_pred = regressor.predict(x_test)
#소수점 둘째 자리까지 보여주기!
np.set_printoptions(precision=2)
#배열 합치기
print(np.concatenate((y_pred.reshape(len(y_pred),1), y_test.reshape(len(y_test),1)),axis=1))
np.set_printoptions(precision=2) : 소수 둘째 자리까지만 보여줌!
np.concatenate : 배열을 합침!
reshap(행, 열) : 행열로 다시 만들어줌
다중선형회귀 모델도, 단순선형회귀 모델과 결국 방법은 똑같다!!
* 다중공선성 문제를 고려해서 더미코딩 변수 하나를 임의로 빼주어야하는가?
-> X ( 자동으로 처리된다 )
* 모형을 만들때 변수선택( 예시, 후진소거법, 전진선택법 등)을 고려해야하는가?
-> X ( 라이브러리가 자동으로 처리해준다 )
반응형
'Udemy Python Machine Learning A-Z' 카테고리의 다른 글
SVR 서포트벡터머신 체험하기! (0) | 2022.09.14 |
---|---|
Polynomial Regression 다항회귀에 대해 알아보자! (0) | 2022.09.12 |
[파트2 섹션6] 단순회귀 Simple Regression (0) | 2022.09.11 |
데이터 전처리 fit, fit_transform, transform의 개념 익히기! (0) | 2022.09.09 |
[Part1, Section 4] Data Preprocessing 데이터 전처리 (2) | 2022.09.07 |
Comments