혜니니의 공부방
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 5일차 본문
23.02.24
#패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석
눈을 안가져와서 눈이 잘 안보이지만 어떻게든 듣고 열심히 필기를 해본다.
1. 최소 자승법
추정된 회귀식에 의해 결정된 값과 실제 종속변수 값의 차이를 최소한으로 줄이는 것을 목적으로 함
최소자승법을 사용한다는 말은 residual2의 합, 즉 다음 수식을 최소화하도록 f(x)의 파라미터를 결정한다는 말이 된다.
(1) f(x)가 직선 ax + b인 경우에는,
(2) 를 최소화하도록 a, b를 결정하는게 최소자승법이다 라고 다른 블로그에서 가져옴,
교수님의 말마따나 실제 종속변수의 값과 예측된 종속변수 값 사이의 오차 제곱항을 최소화 하는 것이 회귀계수의 추정법이다.
최소자승법으로 행렬을 이용한 해를 구하는 것에는 일단 행렬을 이용해서 구하는법이 있다. 이거 완전 수학인데 음..
나중에 재수강을 한번 더 하면서 이해해보도록 노력해야겠다.
- 오차항 엡실론이 정규분포를 따른다.
- 설명변수와 종속변수 사이에 선형관계가 성립함
- 각 관측치들은 서로 독립한다
- 종속변수 y에 대한 오차항은 설명변수 값의 범위에 관계없이 일정함.
1번째 가정 ) 잔차의 정규성
-잔차도는 Residual Plot이라 하고, 이는 특정 설명변수 미 종속변수의 크기에 잔차가 영향을 빋지 않아야한다. 이 그래프의 모형은 선형도 곡선도 안돼고 오로지 일자여야한다.
종속변수의 전체 변동성= 분산 이라고 한다 = 이는 회귀식이 설명할 수 있는 변동성과 회귀식이 설명할 수 없는 변동성 을 합친 부분으로 이 부분 꼭 암기하고 기억해둘 것.
SST /
SSR /
SSE /. 에 대해서 공부하고 알아둘것.
회귀모형의 적합도를 판단하는 것은 결정계수인 R^2이당.
R^2 = 1- SSE/SST = SSR/SST 따라서 결정계수는 0과 1 사이다.
사실 강의에 대한 자료나 그 내용을 고대로 받아적을수는 없는 부분이라 1000자를 채우는데 조금 고민이 된다. 흠 일단 오늘 이렇게 마무리하고 내일 안내 메일을 보면서 어느정도의 사진을 찍어도 되는지 한번 봐야겠다. 다중 선형 회귀 모형에 대해서는 수식에 대한 이야기가 많이 나오는데 y 햇과 y 바의 개념을 조금 애매모호하게 알고있다본 ㅣ교수님의 설명이 살짝 어려웠던 관계로 구글링으로 통계에 대한 기초를 찾아봐야겠다고 생각했음. ㅠ 오늘은 업무도 무진장바빴고, 통계도해야하고 쉽지않은 인생이야 증말,,
끝.
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.
'공부 기록 > 데이터분석' 카테고리의 다른 글
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 7일차 (0) | 2023.02.26 |
---|---|
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 6일차 (0) | 2023.02.25 |
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 4일차 (0) | 2023.02.23 |
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 3일차 (0) | 2023.02.22 |
패스트캠퍼스 강필성의비즈니스분석 30일 도전 챌린지! 2일차 (0) | 2023.02.21 |