본문 바로가기
개발_TIL

개발_TIL | 2022-05-12(18)

by Hee94 2022. 5. 12.

머신 러닝 시작!

   머신 러닝 시작하기에 앞서 Google Colab을 사용하기 위해 Gmail계정을 생성하고 Kaggle을 위해 Kaggle 또한

   가입하였다.!!

 

   머신러닝의 회귀와 분류

   1) 회귀 (Regression)

      출력값이 연속적인 소수점으로 예측하게 하도록 푸는 방법

   2) 분류 (Classification)

     0,1로 나누는 이진 클래스(Binary class) = 이진 분류(Binary classification) 와 여러개의 클래스로 나누는

     다중분류(Multi-class classification, Multi-label classification)으로 나뉜다.

 

   머신러닝의 3가지 학습

   1) 지도 학습

     정답을 알려주면서 학습 시키는 방법

   2) 비지도 학습

     정답을 알려 주지 않고 군집화 하는 방법

   3) 강화 학습

     주어진 데이터 없이 실행과 오류를 반복하면서 학습 하는 방법(ex.알파고)

 

선형 회귀

   선형 회귀란?

   - 두 데이터 간의 직선 관계를 찾아내서 x값이 주어졌을 때 y값을 예측 하는 것!

     가설을 세우고 손실 함수를 최소화 한다!

 

경사 하강법(Gradient descent method)

   목표는 손실 함수를 최소화 하는것이기때문에 그래프의 경사를 따라 조금씩 이동하면서 진행하는 것

   여기서 한 칸씩 전진하는 단위를 Learning rate라고 부르며, 그래프의 최소점에 도달하게되면 학습이 종료된다.

 

데이터셋 분할

데이터셋 분할

   1) Training set(학습 데이터셋, 트레이닝셋) =>교과서

     머신러닝 모델을 학습시키는 용도.(보통 전체의 80%정도를 차지함)

   2) Validation set(검증 데이터셋, 밸리데이션셋) =>모의고사

     머신러닝 모델의 성능을 검증,튜닝하는 지표의 용도. 모델에게 데이터를 직접 보여주지는 않아 모델의 성능에

     영향을 미치지 않음.

   3) Test set(평가 데이터셋, 테스트셋) =>수능

     정답 라벨이 없는 실제 환경에서의 평가 데이터셋.

'개발_TIL' 카테고리의 다른 글

개발_TIL | 2022-05-16(20)  (0) 2022.05.16
개발_TIL | 2022-05-13(19)  (0) 2022.05.13
개발_TIL | 2022-05-11(17) // feat) KPT  (0) 2022.05.11
개발_TIL | 2022-05-04(13)  (0) 2022.05.04
개발_TIL | 2022-05-03(12)  (0) 2022.05.03