일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Computer Vision
- 크롤링
- mnist
- pytorch
- CV
- 인공지능
- 플러터
- 모델
- map
- 유데미
- 42서울
- 머신러닝
- 데이터분석
- 딥러닝
- filtering
- 피플
- Flutter
- AI
- 회귀
- RNN
- 42경산
- Regression
- 선형대수학
- 앱개발
- 코딩애플
- 자연어처리
- 크롤러
- 지정헌혈
- 파이썬
- 선형회귀
- Today
- Total
목록머신러닝 (7)
David의 개발 이야기!
랜덤포레스트는 앙상블 버전의 한 버전. 앙상블 학습은 여러 알고리즘, 같은 알고리즘을 여러개 가져와서 조합해 훨씬 더 강력한 모델을 만드는 기법임. 여러 추측 사이의 평균을 내면, 진실에 가까워질 확률 커짐. * RandomForestRegressor 의 n_estimators(추정기 개수) 설정 중요!! 랜덤포레스트는 나무들이 모여서 아웃풋으로 최종예측을 내놓기 때문! 각 나무는 예측을 하고 랜덤포레스트 자체가 마지막 아웃풋을 판정함! -> 나무의 수가 중요!
의사결정회귀트리 회귀에 대해 알아보자! [ DecisionTree 에 대한 설명 ] 주제 : 직급별 연봉 계산기 위 데이터를 토대로 6.5년차 일때의 연봉을 예측하고자 한다! [ 방법 ] 1. 라이브러리 호출하기 2. 데이터셋 불러오기 3. Decision Tree Regression 모델 학습시키기 4. 새로운 결과 예측하기 5. 시각화 하기 1. 라이브러리 호출하기 import numpy as np import matplotlib.pyplot as plt import pandas as pd 2. 데이터셋 불러오기 dataset = pd.read_csv('/content/drive/MyDrive/Machine Learning A-Z (Codes and Datasets)/Part 2 - Regressio..
머신러닝 프로젝트의 업무프로세스는 다음과 같다 ( 부동산 회사 데이터 사이언티스트라고 가정하고 알아가보자! ) 1. 큰 그림을 본다 2. 데이터를 구한다 3. 데이터로부타 통찰을 얻기 위해 탐색하고 시각화 한다 4. 머신러닝 알고리즘을 위해 데이터를 준비한다 5. 모델을 선택하고 훈련시킨다 6. 모델을 상세하게 조정한다 7. 솔루션을 제시한다 8. 시스템을 런칭하고 모니터링하고 유지 보수 한다 1. 큰 그림 보기 위 데이터 모델을 학습시켜서, 다른 측정 데이터가 주어졌을 때 구역의 중간 주택 가격을 예측하고자 한다! 1.1 큰 그림을 보기 위한 질문들 A. 비지니스의 목적이 정확히 무엇인가요? (문제정의) - 모델을 만들기가 최종 목적이 아님 - 모델을 사용해 이익을 얻을 수 있어야함 B. 현재 솔루션은..
sklearn, 서포트벡터 머신을 활용해서, 호봉에 따른 임금상승을 구해보자! 1. Import Libraries 2. Import Dataset 3. Feature Scaling 4. Training the SVR model 5. Predicting the new result 6. Visualizing the SVR results. 다음과 같은 순서로 분석하고자 한다! 1. Import libraries import numpy as np import pandas as pd import matplotlib.pyplot as plt 2. Import Dataset dataset = pd.read_csv("Position_Salaries.csv") x = dataset.iloc[:,1:-1].values y..
연차에 따라 올라가는 임금을 알아보는 모델을 만들어보자! 1. Importing the libraries import numpy as np import pandas as pd import matplotlib.pyplot as plt 2. Importing the dataset dataset = pd.read_csv("Position_Salaries.csv") x = dataset.iloc[:,1:-1].values y = dataset.iloc[:,-1].values 3. Training the Polynomial Regression model on the whole dataset from sklearn.preprocessing import PolynomialFeatures poly_reg = Polyn..
fit() -> "훈련해라", "머신러닝이 데이터에 머신러닝 모델을 맞추는 것(fit)" 학습데이터 세트에서 변환을 위한 기반 설정을 하는 함수이다! 데이터를 학습시키는 메서드라고 생각하면 된다. transform() -> fit 을 기준으로 얻은 mean, variance에 맞춰서 변형하는것! 1. fit을 통해 세운 기반으로 변형하는 함수! 2. 실제로 학습시킨 것을 적용하는 메서드라고 생각하면 된다! fit_transform() 이건 그냥 두개 합쳐 놓은 것이라 생각하면 됨! 그렇다면 왜 train dataset에서만 fit_transform 혹은 fit, transform을 할까? from sklearn.preprocessing import StandardScaler sc = StandardSca..