목록공부 기록 (62)
혜니니의 공부방
23.02.26 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 어제까지 총 9개의 클립 완강했다. 하루에 2클립을 들은 날도 있었고, 오늘은 주말로 피곤하니 하나만 수강했다. 강의 모습을 직접 찍는건 쫌 그러니까... 필기를 적으면서 하다보니 어디 따로 기록하지는 않는다. 그리고 교수님이 설명해주신 것 외에도 따로 찾아보는게 좋다고 생각해 구글링해서 참고하는 편이다. * 학습데이터에 대해서 100% 정확한 모형을 만들면 좋은것인가? No 그렇지않다. 과적합 발생가능성이 있다. ---- > 따라서 우리는 성능평가를 하기 위해 다양한 알고리즘을 사용한다. 분류: 나이브 베이즈, 선형, K-인접,의사결정나..
23.02.25 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 SST: 총 변동값, 개별 y의 편차제곱의 합 SSR : 설명된 변동값으로, 추정y의 편차제곱의 합이다. 경우에 따라 SSR로 표현하는 경우도 있음에 유의할 것, SSE: 설명 안된 변동값으로. 잔차의 제곱합이다. 경우에 따라 sse로 표현하는 경우도 있음. 회귀모형의 적합도를 판단하는 것은 결정계수인 R^2이당. R^2 = 1- SSE/SST = SSR/SST 따라서 결정계수는 0과 1 사이다. 결정계수는 상관계수의 제곱이고, 이는 회귀식이 자료를 얼마나 잘 설명하고 있는가를 나타내는 계수이다. 보통 0.65 이상이면 잘 설명한다고 하지..
23.02.24 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 눈을 안가져와서 눈이 잘 안보이지만 어떻게든 듣고 열심히 필기를 해본다. 1. 최소 자승법 추정된 회귀식에 의해 결정된 값과 실제 종속변수 값의 차이를 최소한으로 줄이는 것을 목적으로 함 최소자승법을 사용한다는 말은 residual2의 합, 즉 다음 수식을 최소화하도록 f(x)의 파라미터를 결정한다는 말이 된다. (1) f(x)가 직선 ax + b인 경우에는, (2) 를 최소화하도록 a, b를 결정하는게 최소자승법이다 라고 다른 블로그에서 가져옴, 교수님의 말마따나 실제 종속변수의 값과 예측된 종속변수 값 사이의 오차 제곱항을 최소화 하는..
23.02.22 21: 21 ~ 22:10 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 머신러닝 활용 사례에 대한 강의를 들었다. 1. 반도체공정의 가상계측 2. 반도체공정의 가상계측 신뢰도추정 3. 가상계측 예측 정확도 향상 4. 설비 및 시스템 이상상태 탐지 - 화학공정의 비계획 가동정지 전조증상 탐지 각 프로젝트에 대한 도메인, 상황에 대한 이해가 필요하다. 교수님은 그 부분에 대해 잘 이해하고 계셨다. 반도체공정의 경우 산업공학은 크게 접목이 있기 어려운데 그 내용을 이렇게 강의에서 설명해주신다는건 내용을 전부 이해하시고 알고계시니까 가능한것이라고 생각한다. 무엇보다 시각화에 대한 실제 부분..
23.02.22 22: 31 ~ 22:51 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 1. 지도학습 : 입/출력 변수가 정해져있음, 둘 사이의 관계를 규명하는 학습 정답이 존재한다 -> 기계학습, 머신러닝, 밥을 줘야지 공부하는애, 직접 하나하나 떠먹여 줘야한다. - 분류: 명목형 변수 예측 - 회귀: 연속형 변수 예측 - 군집화: 유사 개체들의 집단을 판별한다. K-평균 군집화/ 계층 군집/군집을 하는 방법은 다양함. Clustering - 군집화에서는 이상치 탐지를 한다. 이상치 탐지는 영어로 Anomaly Detection이다. 2. 비지도학습 :: 출력 변수가 없는 데이터의 특질이나 특성을..
23.02.21 21: 07 ~ 21:36 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 1. 데이터기반의 문제해결 해결단계 문제 정의-데이터 획득-데이터 탐색-모델링-결과토론 및 시각화 a. 문제정의 : 흥미로운 문제를 발견하자! 문제를 규명하는단계가 제일 중요하다. 이 과정을 통해서 어떤 모델을 설계할지 판가름이 난다. 예시를 통하자면. ex. 이상치탐지, 예측, 등 결국은 통계기반 내용들이다. b. 데이터 획득 : 데이터에 대한 유용성을 비롯한 품질을 꼭 따져야한다. 좋은 데이터가 좋은 모델을 만든다. AI모델을 기획할 때 데이터 수집에 대한 단계부터 기획해야한다. AI 코드들은 공개된 연구 논..
23.02.23 01, 02 - 데이터 기반 수강 완료 1.2배속하고 들었다. 1배속하면 넘 느리고 졸음이 와서. 살짝 타이트한 속도로해야 안지루하고 잘들음 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 데이터사이언스- 데이터기반의 의사결정을 위한, 데이터 사이언스는 수학통계학+컴퓨터사이언스/IT지식+도메인/비즈니스관점을 아우를 수 있는 것이 데이터 사이언티스트라고 함 -- > 두가지를 마스터하고 한가지를 향해가기를 바람, 나는 컴퓨터 사이언스와 도메인 비즈니스관점이 채워졌다면 통계를 바라보아야할것같다. 1. 연역법/귀납법 - 학습/검증 - 머신러닝시 학습용 데이터 검증용데이터를 구분하는게 좋다. 이..
감사하게도 좋은 기회가 생겨 데이터그립 6개월을 무료로 사용할 수 있게 되었다. 기존에 PyCharm과 IntelliJ는 학교 아이디로 사용하고 있었고, 학교 이메일이 만료되어서 더이상 쓸 수 없었다. 그래서... 계정을 새로 생성했다. 저번에 빅쿼리 환경구축할 때 Dbeaver, MySQL Workbench등 써봤었고. 그 중 사용못해본게 데이터그립이다. 지인짜 써보고싶었는데 행복. 괜찮으면 년결제 해봐야지.ㅎ 등록하고나면, 젯브레인에서 메일과 함께 영수증이 온다. 나의 라이센스 페이지에 보면 이렇게 데이터그립이 생긴다. ㅎㅎ 보통 대부분 설치하는 티스토리 글들이 많은데 나중에 제거하는 과정이 불편하기도하고 무설치가 편해서 애용하는 편이다. 다운로드 버튼을 클릭하면 이렇게 2가지 버전이 나오는데 zip..