본문 바로가기
반응형

핸즈온 머신러닝6

Chapter 4 - 모델 훈련(1) ## 1. 선형회귀 선형회귀는 입력 특성의 가중치 합과 편향(theta0)라는 상수를 더해 예측을 만드는 것이다. 다음과 같이 벡터 형식으로도 나타낼 수 있다. 행렬곱을 이뤄내기 위해 theta에 전치를 한다. 이러한 선형 모델의 비용함수는 어떤 것이 있는지 살펴보자. 앞서 회귀에서 MSE의 지표를 다뤘다. 이 MSE함수를 다시 언급한다. 이러한 평균오차제곱(MSE)를 최소화 하는 것이 모델 훈련의 목표이다. - 정규방정식 : 비용 함수(여기서는 MSE)를 최소화하는 theta 값을 찾아주는 방법을 정규방정식이라고 한다. 이 정규 방정식을 테스트하기 위해서 y = 4+3x + noise라는 식을 생성한다. X = 2*np.random.rand(100,1) y = 4+3*X+np.random.randn(1.. 2021. 1. 31.
Chpater3 - 분류 이 장에 앞서 데이터셋을 다운 받아야한다. MNIST라는 데이터 셋을 다운 받는다. 이 데이터셋은 sklearn 모듈에 포함 되어 있으므로 이를 다운 받으면 된다. from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784',version=1) mnist 위 데이터 셋은 7만개의 행과 784개의 열로 이루어져 있다. 각 열은 pixel 하나의 값이므로 한 글자의 크기가 28x28 로 이루어져있다. 이 중 하나의 숫자를 시각화 해보면 다음과 같다. import matplotlib some_digit=X[36000] some_digit_image = some_digit.reshape(28,28) some_digit_image plt.i.. 2021. 1. 10.
Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(3) 2021/01/04 - [핸즈온 머신러닝] - Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(1) Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(1) Big Picture : 비즈니스의 목적이 무엇인지 정확히 판단해야한다! 성능 지표 선택: - RMSE(평균 제곱 오차): np.sqrt(mean_square_error(true_y,pred_y) - MAE(평균 절대 오차) : mean_absolute_error(treu_y,.. bigdata-analyst.tistory.com 2021/01/05 - [핸즈온 머신러닝] - Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(2) Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(2) 2021/01/04 - [핸즈온 머신러닝] - Ch.. 2021. 1. 5.
Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(2) 2021/01/04 - [핸즈온 머신러닝] - Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(1) Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(1) Big Picture : 비즈니스의 목적이 무엇인지 정확히 판단해야한다! 성능 지표 선택: - RMSE(평균 제곱 오차): np.sqrt(mean_square_error(true_y,pred_y) - MAE(평균 절대 오차) : mean_absolute_error(treu_y,.. bigdata-analyst.tistory.com ## 머신러닝을 위한 데이터 준비 데이터 전처리 자동화를 만드는 이유 - 어떤 데이터셋에 대해서도 변환을 빠르게 반복할 수 있다. - 변환 라이브러리 점진적 구축 가능 - 새 데이터를 주입하기 전에 변환시키는데 함수.. 2021. 1. 5.
Chapter2 - 머신러닝 프로젝트 처음부터 끝까지(1) Big Picture : 비즈니스의 목적이 무엇인지 정확히 판단해야한다! 성능 지표 선택: - RMSE(평균 제곱 오차): np.sqrt(mean_square_error(true_y,pred_y) - MAE(평균 절대 오차) : mean_absolute_error(treu_y,pred_y) 2021. 1. 4.
Chapter1 - 한눈에 보는 머신러닝 한눈에 보는 머신러닝 머신러닝이란? 머신러닝은 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구분야 예시 : 스팸 필터 Training Set : 시스템이 학습하는데 사용하는 샘플 Tranining Data : 이 메일은 스팸이다라는 경험 Accuracy : 성능 측정(정확도) 왜 머신러닝을 사용하는가? 오차 분석 등을 통해 새로운 오차들을 학습시켜서 더 좋은 예측 성능을 낼 수 있음 데이터 마이닝(Data Mining) : 머신러닝 기술을 적용해서 대용량의 데이터를 분석하면 겉으로 보이지 않던 패턴을 발견할 수 있음 머신러닝을 사용했을 때 더욱 효율적인 분야 ``` 기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제 전통적인 방식.. 2020. 12. 29.
반응형