혜니니의 공부방

패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 11일차 본문

공부 기록/데이터분석

패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 11일차

니니혜 2023. 3. 2. 22:22

23.03.02

#패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석

퇴근하고와서 강의듣기. 오늘 그래도 1주차 통과 ~~ ! ~~ ! 목요일하면, 금 토 일 남으면 벌써 절반이나 한다.

근데 오늘 강의는 1강이 살짝 짧고 교수님의 예시가 많아서 인터넷에서 추가 자료를 찾ㅇ아 넣엇다., 

 


1. 다항 로지스틱 회귀분석 

 - 지금까지 로지스틱 회귀분석은 이범주 분류 Binary Classification를 풀기 위한 방식이다. 하지만 범주가 3개 이상인 다범주 분류에서는 ?  

- 기준 Baseline 이되는 범주를 설정하고, 이 범주 대비 다른 범주가 발생할 로그 승산을 회귀식으로 추정하는 ㅓㅅ이다.

p / 1-p = 성공범주(1범주) / 성공이 아닌 범주(0범주)

 

- 범주는 3개인데 왜 2개의 모형만 학습하는가? 

 - 로지스틱 회귀분석에서 각 범주에 속할 확률의 합은 항상 1이므로 나머지 K번째 범주에 대한 확률은 자동으로 산출된다.

 

2. 회귀계수 분석

- 개별모형에 대해서 회귀계수와 이에 대한 유의확률 산출 가능

- 오차제곱합을 최소한으로 하는 값들

- 이를 만족하는 최적의 계수들은 회귀계수에 대해 미분한 식을 0으로 놓고 명시적인 해를 구할수 있다고한다. 

다중선형회귀분석 식 

장점: 여러 집단 간의 비교가 가능하다.

단점: 종속변수의 참조 변수 및 독립변수의 참조 집단을 동시에 기준으로 하기 때문에 해석이 난해하다.

 

 

 = 이 다항 로지스틱 회귀분석 함수는 소프트맥스 함수와 모양이 동일하다. 

 

 

소프트맥스 함수는 출력층에서 사용되는 함수이다. 이 외에도 항등 함수, 시그모이드 함수가 존재한다. 항등 함수의 경우 입력값이 그대로 출력되는 함수로 회귀 모델을 만들 때 사용한다.

 

소프트맥스 함수 다중 클래스 분류 모델을 만들 때 사용한다. 결과를 확률로 해석할 수 있게 변환해주는 함수로 높은 확률을 가지는 class로 분류한다. 이는 결과값을 정규화시키는 것으로도 생각할 수 있다. 

 

소프트맥스함수를 이용해서 모델을 돌리는 예시로 Iris 데이터를 이용한 분류 모델이 있다.  Iris 데이터 활용해서 붓꽃 분류하기 따로 찾아볼 것,

 

머신러닝에서 로지스틱 회귀분석과 시그모이드, 소프트맥스의 관계에 대해 잘 정리한 티스토리가 있어 인용해보았다.

 

- logit과 sigmoid는 서로 역함수 관계이고

- 2개 클래스 대상으로 정의하던 logit을 K개의 클래스를 대상으로 일반화하면 softmax함수가 유도된다.

- softmax함수에서 K=2로 두면 sigmoid함수로 환원이 되고, 반대로 sigmoid함수를 K개의 클래스로 일반화하면 softmax함수가 유도된다. 

- 신경망에서 sigmoid는 활성화 함수로 softmax는 출력층에 사용되지만, 수학적으로는 서로 같은 함수이다. 

 


본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.

http://bit.ly/3Y34pE0

 

 

Comments