로지스틱 선형(Rogistic Regression)
로지스틱 회귀는 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는 데 사용되는 통계 기법이다._위키피디아
로지스틱 회귀는 수학을 사용하여 두 데이터 요인 간의 관계를 찾는 데이터 분석 기법이다. 그런 다음 이 관계를 사용하여 다른 요인을 기반으로 이러한 요인 중 하나의 값을 예측한다. 예측은 일반적으로 ‘예’ 또는 ‘아니요’와 같이 유한한 수의 결과를 가진다.
로지스틱 회귀를 위한 함수로는 시그모이드(Sigmoid) 함수를 사용한다.
Sigmoid function: 11+e−x

로지스틱 함수 개념
- odds = p1−p 라고 하자. 여기서 p는 성공확률, (1-p)는 실패확률이다. 즉 odds는 실패 확률 대비 성공 확률의 비(ratio)이다.
- odds = p1−p=eα+βx 라고 정하자. 둘 다 출력 값 범위가 같다.
- 위 식의 양 변에 로그를 적용하면 α+βx=log(p1−p)로 바꿀 수 있다. 이 때, (α+βx)를 새로운 변수 t라고 하자.
- f(t)=11+e−t 식을 시그모이드 함수 혹은 로지스틱 함수라고 한다. 여기서 함수의 x축은 독립 변수의 선형 결합이다.
로지스틱 함수 유도
- p1−p=et 라고 위 개념에서 정의했다. 다음으로 양 변에 역수를 적용하자.
- 1−pp=1p−1=1et 식에 다시 양 변에 1을 더하자.
- 1p=1et+1=1et+etet=et+1et
- p=et1+et=11+e−t 마지막 항은 분자, 분모에 et를 나눈 값이다.
로지스틱 함수를 사용하면 입력 t=α+βx (범위: [−∞,∞] )를 넣으면 p (범위: [0, 1]) 출력을 얻을 수 있다. 여기서 α,β 는 파라미터이고 우리가 찾아야 할 값이다. [참고자료 1]
위 포스팅은 이항 로지스틱 회귀를 예시로 들었다. 다항 로지스틱 회귀는 t 값이 α+βx 가 아닌 α+βixi 이다. 여기서 i는 index이다.
참고자료
https://angeloyeo.github.io/2020/09/23/logistic_regression.html
로지스틱 회귀 - 공돌이의 수학정리노트 (Angelo's Math Notes)
angeloyeo.github.io
https://mazdah.tistory.com/769
로지스틱(Logistic) 회귀 함수 살펴보기
로지스틱 회귀 분석 이해를 위한 수학 지식 들어가는 말 앞서 단순 선형 회귀에서 다중 선형 회귀로 넘어갈 때도 단지 변수 하나가 더 추가되었다는 이유만으로 한참을 헤맸다. 그런데 로지스틱
mazdah.tistory.com
https://ko.wikipedia.org/wiki/%EB%A1%9C%EC%A7%80%EC%8A%A4%ED%8B%B1_%ED%9A%8C%EA%B7%80
로지스틱 회귀 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전. 로지스틱 회귀(영어: logistic regression)는 영국의 통계학자인 D. R. Cox가 1958년[1]에 제안한 확률 모델로서 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을
ko.wikipedia.org
https://aws.amazon.com/ko/what-is/logistic-regression/
로지스틱 회귀란 무엇인가요? - 로지스틱 회귀 모델 설명- AWS
로지스틱 회귀는 수학을 사용하여 두 데이터 요인 간의 관계를 찾는 데이터 분석 기법입니다. 그런 다음 이 관계를 사용하여 다른 요인을 기반으로 이러한 요인 중 하나의 값을 예측합니다. 예
aws.amazon.com
'수학' 카테고리의 다른 글
[수학] 퓨리에 변환 (Fourier Transform) (0) | 2024.09.19 |
---|