Yet Never Lose Faith

- Good to Great , Jim Collins

How To Preprocess Image Data 자세히보기

Deep Learning/[Books] Do it! 정직하게 코딩하며 배우는 딥러닝 입문

2. 머신러닝 필수용어 5가지 (모델, 학습, 훈련, 입력, 타깃)

Kellyyyy 2020. 6. 4. 08:00

 

 

 

이번 포스팅에서는 머신러닝/딥러닝을 이해하는데 필요한 필수용어 5가지를 정리해본다.

 


 

| 1.모델

 

 

모델(model)은 프로그램을 의미한다.

 

만약 당신이 강수여부를 예측하는 인공지능 프로그램을 만든다고 하면,

그것은 다시 말해 강수여부를 예측하는 인공지능 모델을 만든다는 의미이다.

 

인공지능 프로그램 = 인공지능 모델

 

 

| 2. 학습

 

 

학습의 의미에 대해서는 저번 포스팅에서 자세하게 다뤘으니 의미만 언급하고 넘어가겠다.

 

학습이란 컴퓨터가 스스로 데이터의 규칙을 찾는 기술을 의미한다.

(자세한 내용은 아래 포스팅 참고!)

 

2020/06/01 - [Deep Learning/[Books] Do it! 정직하게 코딩하며 배우는 딥러닝 입문] - 1. 인공지능, 머신러닝, 딥러닝 기초개념 다지기

 

 

| 3. 훈련

 

 

훈련은 말 그대로,  학습을 구현하기 위한 과정이다.

 

'컴퓨터가 스스로 데이터의 규칙을 찾는다' 라는 결과학습이라면,

데이터의 규칙을 찾고 정확도를 높이는 방향으로 수정하는 과정 훈련이다.

 

훈련 = 학습의 과정

 

 

| 4. 입력

 

 

입력이란 모델(프로그램)이 규칙을 찾아야 할 대상이다.

 

강수여부를 예측하는 프로그램이라면,

습도 데이터의 규칙을 찾아서 강수여부를 예측할 수 있다.

 

따라서 강수여부 예측 프로그램에서 입력이란 습도 데이터를 의미한다.

 

 

| 5. 타깃

 

 

타깃은 모델(프로그램)이 맞춰야 할 정답을 의미한다.

 

강수여부를 예측하는 프로그램에서는

강수여부를 맞춰야 하기 때문에 타깃이란 강수여부 데이터를 의미한다. 

 


 

- 정리 -

EX. 강수여부 예측하는 인공지능 프로그램

 

모델 : 강수여부를 맞추는 프로그램

학습 : 습도와 강수여부 사이의 규칙을 찾음

훈련 : 습도와 강수여부 사이의 규칙을 찾는 과정

입력 : 과거 습도 데이터

타깃 : 강수여부 데이터

 


 

위 개념들을 좀 더 구체적으로 살펴보자.

 

대부분의 머신러닝 알고리즘은 입력과 타깃의 관계를 식으로 표현할 수 있다.

강수여부를 예측하기 위한 입력과 타깃을 살펴보고, 식으로 표현해보자.

 

습도(입력)강수여부(타깃)
0.8O
0.2X
0.7O
... 
0.5X

 

다양한 식을 작성할 수 있겠지만,

나는 1.5*x + 0.1 = y (y가 1이상이면 비가온다고 예측)로 표현해보았다.

놀랍게도 위 식도 머신러닝 알고리즘 중 하나로, 선형회귀의 일종이다.

(물론 정확도는 턱 없이 낮을 것이다.)

 

위 식에서 각 변수가 무엇을 의미하는 정리해보면 다음과 같다.

x = 습도데이터 = 입력
y = 강수여부 = 타깃

 

그렇다면 1.5와 0.1은 무엇일까?

바로 규칙이다.

 

나는 습도데이터에 1.5를 곱하고 0.1을 더해서 1보다 크면 비가 온다는 식을 세웠고,

1.5와 0.1로 규칙을 표현한 것이다.

 

이 규칙들은 각각 가중치절편이라고 부르는데

입력과 곱하는 수(1.5)가 가중치, 더하는 수(0.1)가 절편이다.

 

머신러닝 알고리즘은 이 규칙들을 수정해나가면서 (훈련)

가장 높은 정확도를 내는 모델(프로그램)을 만든다. (학습)

 


 

이렇게 머신러닝을 위한 기초용어 5가지를 살펴보았다.

다음 포스팅에서는 머신러닝 알고리즘이 어떻게 규칙을 수정해나가는지 알아보기 위해

머신러닝 학습방식 3가지를 정리해보겠다.