가장 기본적으로 선형회귀는 출력변수(Y)가 "수치형" 일때 쓰인다.
우선, 확정적인(수학적인) 관계와 확률적 관계의 차이를 알아야 한다.
확정적 관계는 "오차"가 존재하지 않고 순수 입력변수만으로 Y를 모두 설명 가능한 관계를 뜻한다.
확률적 관계는 "오차"가 존재하여 순수 입력변수만으로 Y를 모두 설명 불가능한 관계를 뜻한다.
즉 오차가 있냐 없냐의 차이다.
그러므로, 위의 Y는 확률적 관계이다.
선형회귀에서 중요한 것이 있다.
바로 오차항의 가정이 꼭 필수적으로 필요한데, 이를 지켜야 선형회귀모델로 사용가능하다.
첫번째로 오차항은 기댓값이0이고 분산이 시그마 제곱이다.
두번째로 각 오차항은 서로 영향을 주지 않는다.(독립)
설명이 되는 부분이 Y의 기댓값이 되며, 그 Y의 산포는 시그마 제곱이 된다는 뜻이다.
'최적화 및 기계학습 > 기계학습(ML)' 카테고리의 다른 글
적대적 생성 신경망(GAN) 이론 및 과정 (0) | 2024.06.11 |
---|---|
벡터미분(공식,미분으로 증명) (0) | 2024.04.16 |
경사하강법1(Gradient-descent) (0) | 2024.04.16 |
선형회귀(LR)-3 :결정계수와 회귀분석결과 해석. (0) | 2024.04.03 |
선형회귀(LR)-2 : 유도과정,다중선형회귀 (0) | 2024.04.02 |