이번 포스팅에서는 머신러닝/딥러닝을 이해하는데 필요한 필수용어 5가지를 정리해본다.
| 1.모델
모델(model)은 프로그램을 의미한다.
만약 당신이 강수여부를 예측하는 인공지능 프로그램을 만든다고 하면,
그것은 다시 말해 강수여부를 예측하는 인공지능 모델을 만든다는 의미이다.
인공지능 프로그램 = 인공지능 모델
| 2. 학습
학습의 의미에 대해서는 저번 포스팅에서 자세하게 다뤘으니 의미만 언급하고 넘어가겠다.
학습이란 컴퓨터가 스스로 데이터의 규칙을 찾는 기술을 의미한다.
(자세한 내용은 아래 포스팅 참고!)
2020/06/01 - [Deep Learning/[Books] Do it! 정직하게 코딩하며 배우는 딥러닝 입문] - 1. 인공지능, 머신러닝, 딥러닝 기초개념 다지기
| 3. 훈련
훈련은 말 그대로, 학습을 구현하기 위한 과정이다.
'컴퓨터가 스스로 데이터의 규칙을 찾는다' 라는 결과가 학습이라면,
데이터의 규칙을 찾고 정확도를 높이는 방향으로 수정하는 과정은 훈련이다.
훈련 = 학습의 과정
| 4. 입력
입력이란 모델(프로그램)이 규칙을 찾아야 할 대상이다.
강수여부를 예측하는 프로그램이라면,
습도 데이터의 규칙을 찾아서 강수여부를 예측할 수 있다.
따라서 강수여부 예측 프로그램에서 입력이란 습도 데이터를 의미한다.
| 5. 타깃
타깃은 모델(프로그램)이 맞춰야 할 정답을 의미한다.
강수여부를 예측하는 프로그램에서는
강수여부를 맞춰야 하기 때문에 타깃이란 강수여부 데이터를 의미한다.
- 정리 -
EX. 강수여부 예측하는 인공지능 프로그램
모델 : 강수여부를 맞추는 프로그램
학습 : 습도와 강수여부 사이의 규칙을 찾음
훈련 : 습도와 강수여부 사이의 규칙을 찾는 과정
입력 : 과거 습도 데이터
타깃 : 강수여부 데이터
위 개념들을 좀 더 구체적으로 살펴보자.
대부분의 머신러닝 알고리즘은 입력과 타깃의 관계를 식으로 표현할 수 있다.
강수여부를 예측하기 위한 입력과 타깃을 살펴보고, 식으로 표현해보자.
습도(입력) | 강수여부(타깃) |
0.8 | O |
0.2 | X |
0.7 | O |
... | |
0.5 | X |
다양한 식을 작성할 수 있겠지만,
나는 1.5*x + 0.1 = y (y가 1이상이면 비가온다고 예측)로 표현해보았다.
놀랍게도 위 식도 머신러닝 알고리즘 중 하나로, 선형회귀의 일종이다.
(물론 정확도는 턱 없이 낮을 것이다.)
위 식에서 각 변수가 무엇을 의미하는 정리해보면 다음과 같다.
x = 습도데이터 = 입력
y = 강수여부 = 타깃
그렇다면 1.5와 0.1은 무엇일까?
바로 규칙이다.
나는 습도데이터에 1.5를 곱하고 0.1을 더해서 1보다 크면 비가 온다는 식을 세웠고,
1.5와 0.1로 규칙을 표현한 것이다.
이 규칙들은 각각 가중치와 절편이라고 부르는데
입력과 곱하는 수(1.5)가 가중치, 더하는 수(0.1)가 절편이다.
머신러닝 알고리즘은 이 규칙들을 수정해나가면서 (훈련)
가장 높은 정확도를 내는 모델(프로그램)을 만든다. (학습)
이렇게 머신러닝을 위한 기초용어 5가지를 살펴보았다.
다음 포스팅에서는 머신러닝 알고리즘이 어떻게 규칙을 수정해나가는지 알아보기 위해
머신러닝 학습방식 3가지를 정리해보겠다.
'Deep Learning > [Books] Do it! 정직하게 코딩하며 배우는 딥러닝 입문' 카테고리의 다른 글
6. 머신러닝/딥러닝 '지도학습'의 목표 2가지 - 회귀와 분류 (2) | 2020.06.22 |
---|---|
5. 머신러닝, 딥러닝 구현을 위한 기초 패키지 2가지 (numpy, matplotlib) (2) | 2020.06.18 |
4. 머신러닝, 딥러닝 구현 위한 개발 툴 2가지 (Jupyter notebook, Colab) (3) | 2020.06.15 |
3. 머신러닝 학습방식 3가지 (지도학습, 비지도학습, 강화학습) (7) | 2020.06.11 |
1. 인공지능, 머신러닝, 딥러닝 기초개념 다지기 (12) | 2020.06.01 |