머신러닝 핵심 아이디어
머신러닝의 핵심 아이디어는 X와 Y의 관계를 찾는 것이다. 여기서 우리의 주 관심은 예측하려는 대상인 Y이며, Y를 설명하는 X 변수는 보통 여러 개이기 때문에 여러 개의 X와 Y의 관계를 찾는 것이다. 이를 위해 X 변수들을 조합(결합)하여 Y를 표현하며, 조합하는 방법은 무수히 많다. 이는 수학적으로 Y = f(X1, X2, ..., Xp)로 표현된다.
만약, X1과 X2 두 개의 변수로 Y를 설명하려고 할 때, 이에 대한 수식은 다음과 같이 표현할 수 있다.
w1과 w2는 파라미터, 혹은 모수, 매개변수라고 부른다. 머신러닝 모델의 핵심은 결국 주어진 데이터를 통해 모델의 파라미터를 찾는 것이라고 할 수 있다.
파라미터 추정
`Loss function(손실 함수)`의 경우 개별적인 데이터의 오차를 정의하는 것이며, `Cost function(비용 함수)`는 손실 함수를 다 더하거나, 평균을 취하는 형태로 나타낸 함수이다. 이 둘은 구별을 안하고 사용하는 경우도 많다.
결국 머신러닝 모델의 핵심은 비용함수를 최소로 하는 매개변수(w1, w2)를 찾는 것이다. 이를 수식으로 나타내면 다음과 같다.
머신러닝 모델 학습 과정 요약
- 모델 결정하기(Y를 표현하기 위한 X들의 조합 방식 결정)
- 모델을 구성하는 파라미터 찾기(모델의 핵심) → 가지고 있는 데이터를 이용하여 실제 데이터의 값과 최대한 값게 나오도록
이 포스팅은 고려대학교 산업경영공학부 김성범 교수님 유튜브의 핵심 머신러닝 강의를 듣고 작성한 글입니다.