목록공부 기록/데이터분석 (37)
혜니니의 공부방
23.03.14 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 오늘은 화이트데이래~~~ 평소에 신경도 안쓰고살았는데 ㅋㅋㅋㅋ 회사 다니니 더 챙기는듯. 1. 연관규칙분석, 장바구니 분석 이러한 장바구니 분석은 각 상품 간의 연관 규칙을 이용하여 분석하게 되는데요, A라는 상품과 B라는 상품이 서로 연관성이 있다고 하면 A->B라고 하는 연관 규칙을 만들 수 있습니다. 하지만 상품이 수백, 수천개라면 이러한 연관 규칙도 엄청나게 많이 생성되어서 이 중에 과연 어떤 연관 규칙이 가장 크리티컬하게 사용될 수 있는지 평가가 필요합니다. 이러한 연관 규칙 평가에는 3가지 척도가 쓰이는데 바로 '지지도, 신뢰도..
23.03.13 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 .. 하 진짜 몸상태 너무너무 힘든 컨디션. 그럼에도 불구하고 환급챌린지는 계-속-된-다,,,,됴르륽 1. 오류 역전파 알고리즘 Error Back- Propagation by Gradient Descent -K번째 관측치의 오차 - MLP는 과적합의 위험이 상대적으로 큰 모형이다. 데이터의 일반적인 특징뿐만 아니라 노이즈Noise로 인해 발현되는 학습 데이터만의 매우 특수한 상황도 외워버리려는 경향을 나타낸다. 그럼에 따라 학습 종료에 사용되는 다양한 조건들에 있는데 1) 연속된 두 Epoch 사이 가중치 변화량이 작을 경우 2) 검증데..
23.03.12 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 우아아아아 벌써 21일차 믿을 수 없다. 9일만 더하면 이제 끝 ~! ~! 이거 끝나면 건강 좀 챙기고 쉬다가 닷 ㅣ또 하나 공부해야지. 1. 다층 퍼셉트론 -문제를 한꺼번에 풀지않고 풀 수 있는 형태의 문제 여러개로 나누어서 풀기. 활성함수를 여러개 사용하는 퍼셉트론/ - 예측력이 우수하다. : 분류 경계면을 여러 직선들의 집합으로 가정하면 로지스틱 회귀분석, 의사결정나무, 인공신경망의 특징 - 분류 경계면 생성에 있어 가장 인공신경망 자유도가 높다. 기초구조 : 1개의 은닉층을 가진 Feed-forward Neural Network (..
23.03.11 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 1. 인공신경망 / 벌써 8단원. 이제 남은 시간들은 R과 파이썬 실습들이 가득하지만 일단 이론먼저 훑자. 뭔가 한번만 들어서 전부 이해하기가 쉬운 내용이 아니기 때문에 처음은 가볍게 훑기 형식으로 듣고. 추후 직접 실습해보고 복습이 추가로 많이 남은 것 같다. - 뉴런의 작동방식, 인간의 사고방식을 모방한 컴퓨팅 시스템이다. - 뉴런은 계속해서 시그널을 받고 조합Sum 하고 특정Threshold가 넘어서면 Fire을 한다. 이러한 뉴런의 구조에 따라 모사한 것이 퍼셉트론 1. 퍼셉트론 - 목적: 주어진 학습데이터의 입력정보와 출력정보의 ..
23.03.10 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 K 인접 이웃 기법 K-최근접 이웃(K-NN, K-Nearest Neighbor) 알고리즘은 가장 간단한 머신러닝 알고리즘으로, 분류(Classification) 알고리즘이다. 비슷한 특성을 가진 데이터는 비슷한 범주에 속하는 경향이 있다는 가정하에 사용한다. 예를 들어 위와 같이 데이터가 주어져 있을 때, 빨간색인 세모 모양의 데이터는 초록색 그룹과 노란색 그룹 중 어디에 속한다고 말할 수 있을까? 주변에 가까운 데이터들이 모두 노란색이기 때문에 '노란색 그룹에 속할 것이다'라고 추측할 수 있다. 이처럼, 주변의 가장 가까운 K개의 데이..
23.03.09 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 하.. 이번주도 성공!! 다음주도 꼭 성공하쟈!!!!! 1. 유전알고리즘 - 휴리스틱 기반의 변수 선택 기법들의 한계점 전역탐섹: 최적 변수집합 선정을 보장하나 너무 오랜시간이 걸림 전진선택/후진소거/단계적선택 : 전ㅇ역탐색에 비해서는 매우 효율적이지만 최적 변수집합을 찾을 가능성이 낮아짐 유전 알고리즘은 존 홀랜드(John Holland)가 1975년에 저서 "Adaptation on Natural and Artificial Systems" 에서 처음 소개한 최적화 기법이며 실제 생물 진화를 모방해서 문제를 해결하는 진화 연산의 대표적인..
23.03.08 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 너무힘들고....진자..야근하고와서 하는 강의란 한귀로 흘려지는거시다.. 복습 꼭 해야지 ㅠㅠ 1. 전진선택법 이론적(theory)으로는 변수의개수가 증가할 때 모델의성능도 증가한다. 하지만, 현실(reality)에서는 변수의 개수가 선형적으로 늘어날 때, 동일한 설명력을 갖기 위해 필요한 객체의 수는 지수적으로 증가하며 차원이 너무 커지면 아래와 같은 문제점을 야기한다. : 영모델(Empty Model)에서 시작하여 모든 독립 변수 가운데 종속 변수와의 단순 상관 계수의 절댓값이 가장 큰 변수를 모델에 포함시킴 : 부분 F 검정으로 유의..
23.03.07 #패스트캠퍼스 #패캠챌린지 #수강료0원챌린지 #환급챌린지 #직장인인강 #직장인자기계발#패캠인강후기 #패스트캠퍼스후기 #오공완 #강필성의비즈니스데이터분석 오늘 정말 힘든 하루다. ㅠ.... 건강때문에 운동도 매일하는데 물라 운동하고 공부하는 돼지임. 목요일 연락은 빨리주려나... 끝까지 완주 제발 하고싶다. 나 진도는 많이 못뺐어도 하루 한강 들으면서 강의노트 정리하고이짜나요ㅠ 좀 봐줘~ 1. 회귀나무 이런 형태의 의사결정나무는 선형 회귀분석으로 추정하는 것이 적합하다. 대체적으로 제조업에서 이런 형태들이 나타난다. 이런 회귀노드에서는? 말단 노드의 예측값을 추정한다. 양 범주의 데이터를 보고 하는데. Split point라는게 있음. 이건 계단식의 회귀식으로 추정하면 이해가 쉬울 것 같다..