혜니니의 공부방

패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 9일차 본문

공부 기록/데이터분석

패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 9일차

니니혜 2023. 2. 28. 22:40

23.02.28

#패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석

으으 오늘도 너무힘들고... 퇴근후는 너무 힘들다,, 

 


1. 로지스틱 회귀분석: 학습

 - 우도함수

: 개별객체의 우도함수는 해당 학습데이터가 정답 범주에 속할 확률

 - 데이터의 생성 과정이 독립임을 가정할 수 있을때, 전체 데이터셋의 우도함수는 개별 객체의 우도함수를 모두 곱한 값이다.

- 일반적으로 데이터 셋의 우도함수는 매우 작은값을 가지므로 로그 우도함수를 주로 사용한다.

P (A,B) = P(A) * P(B) 우도함수값은 크면 클수록 좋다.

 

 - 첨도

 

2. 최대 우도 추정법 Maximun likelihood estimation

- 학습데이터의 개별객체들이 갖는 정답 범주에 대한 확률을 극대화하는 방법

- 성공확률에 대한 식을 살펴볼 수 있다.

i번째 객체에 대한 우도 함수로

출력변수가 1과 0임을 고려하여 다음과 같이 변형이 가능하다.

만약에 학습 데이터셋의 객체들이 독립적으로 발생됨을 가정할 경우, 전체 데이터 셋에 대한 우도함수는 다음과 같다.

여기에 로그를 취한다.

우도함수와 로그-우도함수는 회귀계수 베타에 대해 비선형이므로 선형회귀분석과 같이 명시적인 해가 존재하지 않게된다. 이는 주로 최적화 알고리즘을 사용하여 해를 찾게 된다.

 

 

3. 기울기 하강 ( Gradient descent algorithm)

 경사하강법이 생각나는군..... 그래프가 하강이 되며 비용함수에 대해 1차 미분을 수행한 뒤 추후 학습여부를 결정한다.

1차 미분값이 최적이었을때 학습을 종료하지만 그렇지 않을 경우 부호에 대한 반대방향으로 가중치를 이동한다.

그 움직임에 대한건 보통 Adam, RmsProp, 등 다양한 함수들이 전개되어있다. 흠

 

 

*함수의 테일러전개. : 목적함수가 최소화인경우 함수의 1차 미분값이 0이 아니면 기울기의 반대방향으로 이동해야 목적함수의 값을 감소시킬 수 있다. 

 

이 모든 이야기를 종합하면 설명변수의 값을 적절히 취합해서 Sigmoid 함수를 통해 출력값을 산출한다는 이야기다.

 

너무어렵네용...ㅠㅠ 다시한번 복습이 필요할 것같다.

 


 

 

 

 

 

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.

http://bit.ly/3Y34pE0

 

 

 

 

Comments