수치예측 / 범주예측(분류)
- 연속형 데이터 : 데이터 자체를 숫자로 표현(ex> 가격, 길이, 압력, 두께) → `수치예측(Regression)`
- 범주형 데이터 : 원칙적으로 숫자로 표시할 수 없는 데이터(ex> 제품불량여부(양품/불량), 보험사기여부(정상/비정상)) → `범주예측(Classification)`
수치예측 / 범주예측 모델링
수치예측 모델링에선 X와 Y의 관계를 직선으로 모델링한다. 이후 새로운 데이터가 주어졌을 때 해당 직선을 통해 Y 값을 예측한다. 범주예측 모델링에선 실제 숫자를 예측하는 것이 목적이 아니기 때문에, 범주 사이를 잘 나눌 수 있는 모델을 찾고, 해당 모델을 통해 새로운 데이터가 어느 범주에 속하는지 예측하게 된다.
이 포스팅은 고려대학교 산업경영공학부 김성범 교수님 유튜브의 핵심 머신러닝 강의를 듣고 작성한 글입니다.