혜니니의 공부방
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 10일차 본문
23.03.01
#패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석
오늘로 나의 삼일절이 달라졌다. 그냥 평일에 공휴일 하루 있는거 너무 행복하고..ㅋ
재미있는 일 고심스러운일 가득한 오늘이다. 아. 하소연하고싶어라-
오늘 새로 산.. 귀여운 떡메! ㅎㅎ 근데 화면 다 찍으면 안됄거같은데
무슨사진을 넣어야할지 넘 어렵당...
1. 로지스틱 회귀분석의 성공확률
: 회귀식이 양수로 커지면 커질수록 e ^-a= 0에 가까워지고, 음수에 가까워질수록 무한대에 가까워지며 이 숫자는 0에 가까워진다. 실제 사례에서는 특정변수에 대한 확률값은 선형이 아닌 S-커브 형태를 따르는 경우가 많다.
: 금융권에서 제일 많이 활용되고 있다. ex. 신용평가모델
2. 이진분류를 위한 cut-off 설정
: cut-off (Threshold) 임계값
: 일반적으로 0.5가 주로 사용됨
: 사전확률을 고려한 cut-off나 검증데이터의 정확도를 최대화하는 등 사용될 수 있음.
:
3. 로지스틱 회귀분석의 회귀계수의 의미는
:로지스틱 회귀분석에서의 회귀계수는 해당 변수가 1 증가함에 따른 로그 승산의 변화량
---- > Odds ratio!
이는 승산비랑 연계가 되는데. 로지스틱 회귀분석에서 나머지 변수는 모두 고정시킨 상태에서 한 변수를 1만큼 증가시켰을 때 변화하는 Odds의 비율.
따라서 X1이 증가하면 성공에 대한 승산 비율이 위 식의 우항만큼 변화한다는 것이다.
- 회귀계수가 양수로 변수가 증가하면 성공확률도 증가하고 성공범주와 양의 상관관계를 가짐.
-> p가 커진다.
- 회귀계수가 음수로 변수가 감소하면 성공확률도 감소하고 성공범주와 음의 상관관계를 가짐.
-> p가 감소한다.
선형회귀분석이랑 유사하게 표를 획득할 수 있다. (아래 표 참조)
-양수일 경우에는 값이 크고 음수일 경우에는 다르게 나온다.
로지스틱 회귀분석에서 각 변수에 대응하는 베타값 = 회귀계수.
선형회귀분석에서 해당 변수가 1단위로 증가하면 종속변수의 변화량을 의미했지만,
로지스틱 회귀분석에서는 해당 변수가 1단위로 증가할때 로그 승산비의 변화량을 의미한다.
* 유의확률이라는 것은 통계적으로 유의;미한지 여부를 알려주는 지표이다.
보통 95%의 유의확률에 따른다.
유의수준을(a 알파) 로 설정한다. 0.05로 사용함
ex. 통계적으로 유의미하지않지만. 나머지는 모두 유의하다. 등 다양한 방식으로 해석할 수 있다.
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.
'공부 기록 > 데이터분석' 카테고리의 다른 글
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 12일차 (0) | 2023.03.03 |
---|---|
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 11일차 (0) | 2023.03.02 |
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 9일차 (0) | 2023.02.28 |
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 8일차 (0) | 2023.02.27 |
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 7일차 (0) | 2023.02.26 |