본문 바로가기

최적화 및 기계학습/기계학습(ML)

선형회귀(Linear Regression)-1

가장 기본적으로 선형회귀는 출력변수(Y)가 "수치형" 일때 쓰인다. 

우선, 확정적인(수학적인) 관계와 확률적 관계의 차이를 알아야 한다.

확정적 관계는 "오차"가 존재하지 않고 순수 입력변수만으로 Y를 모두 설명 가능한 관계를 뜻한다.

확률적 관계는 "오차"가 존재하여 순수 입력변수만으로 Y를 모두 설명 불가능한 관계를 뜻한다. 

즉 오차가 있냐 없냐의 차이다.

그러므로, 위의 Y는 확률적 관계이다.

 

오차항의 가정

선형회귀에서 중요한 것이 있다.

바로 오차항의 가정이 꼭 필수적으로 필요한데, 이를 지켜야 선형회귀모델로 사용가능하다.

 

첫번째로 오차항은 기댓값이0이고 분산이 시그마 제곱이다.

두번째로 각 오차항은 서로 영향을 주지 않는다.(독립)

 

설명이 되는 부분이 Y의 기댓값이 되며, 그 Y의 산포는 시그마 제곱이 된다는 뜻이다.