혜니니의 공부방

패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 10일차 본문

공부 기록/데이터분석

패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 10일차

니니혜 2023. 3. 1. 22:18

23.03.01

#패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석

 

 

오늘로 나의 삼일절이 달라졌다. 그냥 평일에 공휴일 하루 있는거 너무 행복하고..ㅋ

재미있는 일 고심스러운일 가득한 오늘이다. 아. 하소연하고싶어라-

오늘 새로 산.. 귀여운 떡메!  ㅎㅎ 근데 화면 다 찍으면 안됄거같은데

무슨사진을 넣어야할지 넘 어렵당...


 

1. 로지스틱 회귀분석의 성공확률 

: 회귀식이 양수로 커지면 커질수록 e ^-a= 0에 가까워지고, 음수에 가까워질수록 무한대에 가까워지며 이 숫자는 0에 가까워진다. 실제 사례에서는 특정변수에 대한 확률값은 선형이 아닌 S-커브 형태를 따르는 경우가 많다. 

: 금융권에서 제일 많이 활용되고 있다. ex. 신용평가모델

 

2. 이진분류를 위한 cut-off 설정

: cut-off (Threshold) 임계값

: 일반적으로 0.5가 주로 사용됨

: 사전확률을 고려한 cut-off나 검증데이터의 정확도를 최대화하는 등 사용될 수 있음. 

:

3. 로지스틱 회귀분석의 회귀계수의 의미는

:로지스틱 회귀분석에서의 회귀계수는 해당 변수가 1 증가함에 따른 로그 승산의 변화량

 

---- > Odds ratio!

이는 승산비랑 연계가 되는데. 로지스틱 회귀분석에서 나머지 변수는 모두 고정시킨 상태에서 한 변수를 1만큼 증가시켰을 때 변화하는 Odds의 비율. 

 

따라서 X1이 증가하면 성공에 대한 승산 비율이 위 식의 우항만큼 변화한다는 것이다.

- 회귀계수가 양수로 변수가 증가하면 성공확률도 증가하고 성공범주와 양의 상관관계를 가짐.

-> p가 커진다. 

- 회귀계수가 음수로 변수가 감소하면 성공확률도 감소하고 성공범주와 음의 상관관계를 가짐.

-> p가 감소한다.

 

선형회귀분석이랑 유사하게 표를 획득할 수 있다.  (아래 표 참조)

-양수일 경우에는 값이 크고 음수일 경우에는 다르게 나온다.
로지스틱 회귀분석에서 각 변수에 대응하는 베타값 = 회귀계수.
선형회귀분석에서 해당 변수가 1단위로 증가하면 종속변수의 변화량을 의미했지만, 

로지스틱 회귀분석에서는 해당 변수가 1단위로 증가할때 로그 승산비의 변화량을 의미한다.

 

* 유의확률이라는 것은 통계적으로 유의;미한지 여부를 알려주는 지표이다.

보통 95%의 유의확률에 따른다. 

유의수준을(a 알파) 로 설정한다. 0.05로 사용함

ex. 통계적으로 유의미하지않지만. 나머지는 모두 유의하다. 등 다양한 방식으로 해석할 수 있다. 


 

 

 

 

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.

http://bit.ly/3Y34pE0

 

 

Comments