본문 바로가기

프로그래밍105

iris 분류하기(K-NN모델)_파이썬으로 머신러닝 배우기 머신러닝의 학습 종류는 지도학습 비지도학습 강화학습 이렇게 3가지가 있다. 그 중 K-NN모델을 활용해 지도학습하는 방법을 살펴보자! 1. Confusion Matrix(평가 방법) 2. Confusion Matrix(평가 방법)의 Presicion(정확도), Recall(재현율), F1_scroe(점수) F1_score : 정확도와 재현율을 균등하게 반영 3. 다양한 데이터 수집 UCI 에서 제공하는 다양한 데이터 archive.ics.uci.edu/ml/datasets.php UCI Machine Learning Repository: Data Sets archive.ics.uci.edu Kaggle에서 제공하는 빅데이터 www.kaggle.com/datasets Find Open Datasets an.. 2021. 5. 10.
인공신경망(neural_network)_파이썬으로 머신러닝 배우기 1. 인간 뇌의 특징 인간의 뇌는 100억개의 뉴런과 각 뉴런을 연결하는 6조 개의 시냅스의 결합체라고 한다. 인간의 뇌는 매우 복잡하며, 비선형적이고, 병렬적으로 정보를 처리한다. 2. 인공신경망의 특징 인공신경망은 입력신호, 가중치, 출력신호로 이루어진다. 뉴런은 입력신호에 가중치를 부여함으로써 출력신호를 만들어낸다. 3. neural_network를 활용해보기 손실, 계수, 바이어스, 반복, 출력, 손실, 층수도 나타내보자! 4. Teachable Machine에서 조절 가능한 인자 5. 인자 살펴보기 hidden_layer_sizes = (j,j), max_iter = k, learning_rate_init = i, random_state = 0, tol = 0.01 6. 수학 점수로 총점 예상하.. 2021. 5. 5.
결정 트리(Decision Tree)_파이썬으로 머신러닝 배우기 결정 트리(Decision Tree) 1. 결정 트리(Decision Tree)알아보기 결정 트리는 데이터를 분석하여 이들 사이에 존재하는 패턴을 예측 가능한 규칙들의 조합으로 나타내며, 그 모양이 ‘나무’와 같다고 해서 의사결정나무라 불린다. 질문을 던져서 대상을 좁혀나가는 ‘스무고개’ 놀이와 비슷하다고 볼 수 있다. 결정 트리(Decision Tree)는 분류와 회귀에 사용된다. 분류 기준이 변수 값이 된다. 성별 = 남자, 여자 안경 = 썼다, 안썻다 일처리 = 천천히, 빠르게 등등이 있고 아래 그림처럼 분류 기준에 따라 나누어진다. 2. 정보 획득 이론 정보 획득 이론이란 같은 성질의 것은 증가시키고 다른 성질의 것은 줄이는 것을 의미한다. 엔트로피가 크면 이질성이 크다는 것을 의미하는데 엔트로피.. 2021. 5. 3.
k-근접 모델(KNeighborsRegressor)_파이썬으로 머신러닝 배우기 파이썬으로 머신러닝 배우기 K-NN(nearest neighbor) 모델 K근접모델 1. K-NN알고리즘이란? K-NN알고리즘은 지도 학습 알고리즘 이다. 가장 가까운 이웃끼리 범주화 하는 것을 의미한다. 2. K-NN모델 테스트 import matplotlib.pyplot as plot import numpy as np import math x = np.random.rand(100,1) x = x * 10 - 5 y = np.array([math.sin(i) for i in x]) y = y + np.random.randn(100) from sklearn.neighbors import KNeighborsRegressor model = KNeighborsRegressor() model.fit(x, y) .. 2021. 4. 29.
그레이디언트 부스팅(GradientBoostingRegressor)_파이썬으로 머신러닝 배우기 그레이디언트 부스팅 모듈 사용해보기! 1. 그레이디언트 부스팅이란? 이전 트리의 오차를 보완하는 방법 (랜덤 포레스트를 개선한 방법이다!) 특징 강력한 가지치기 트리의 깊이가 깊지 않다. 무작위성이 없다. 매개 변수 조절이 힘들다. 2. 인자 결정 n_estimator : 트리의 수 max_depth : 트리의 깊이 max_features : 나누는 수 Learning rate : 학습률 랜덤 포레스트에서는 트리의 수가 가장 중요한 인자이고 그레이디언트 부스팅은 트리의 수와 학습률 두 가지가 중요한 인자이다. 3. 그레디언트 부스팅 실제로 사용해보기! x, y 를 랜덤 데이터로 만들어주고 그레디언트 부스팅 모듈을 사용해 예측해보자! import matplotlib.pyplot as plot import .. 2021. 4. 26.
랜덤 포레스트(RandomForestRegressor)_파이썬으로 머신러닝 배우기 앙상블(emsemble) 랜덤 포레스트(Random forest) 모델 1. 랜덤 포레스트(Random forest)란? 의사결정 트리를 랜덤하게 나온 것을 투표하여 결정하는 것이다. 분류, 회귀에 주로 사용된다. Bagging Features 속성이 10개라고 10개 다 선정하는 것이 아니라 10을 제곱근 한 수 만큼 선정한다. 2. 분류 기준 엔트로피 이론 어떤 기준으로 가장 먼저 분류하면 좋을까?에 대해 고민할 때 보통 엔트로피 이론을 적용한다. 3. 랜덤 포레스트 인자 결정 n_estimator = 트리의 수 max_depth = 트리의 깊이 max_features = 나누는 수 n_estimator 는 클 수록 좋다! 트리를 많이 만들어 볼수록 좋다. (경우의 수가 많아진다.) max_featu.. 2021. 4. 26.
서포트 백터 머신(model = SVR(kernel = 'rbf', C=1000, gamma = 1000)_파이썬으로 머신러닝 배우기 이번글에서는 SVR의 kernel 'rbf'의 c옵션과 gamma옵션에 대해 알아보자! C와 gamma값이 바뀔 때 결정계수가 다르게 나오는데 어떻게 바꾸어야 결정계수가 크게 나오는지 실험해보려한다! 1. C와 gamma는 무엇일까? c 는 제약 조건이며 0.1 : 매우 제약조건이 큰 경우 100 : 제약조건이 작은 경우 로 이해하면 된다. gamma는 가우시안 커널의 반경을 크게 또는 작게할 것인지를 의미한다. 사실...c와 gamma가 정확히 무엇인지는 잘 모르겠다. 2. 실전 c와 gamma 조정!! C값이 0.1일 때 gamma값을 0.1, 1, 10, 100, 1000으로 바꾸어가며 결정계수를 확인해보고 그리고 C값이 1일 때 gamma값을 바꾸어가며 결정계수를 확인해보자. 이런식으로 C값이 0.. 2021. 4. 23.
서포트 백터 머신(from sklearn.svm import SVR)_파이썬으로 머신러닝 배우기 기계 학습은 데이터의 특성에 따라 사용하는 모델이 달라진다. 그래서, 데이터의 특징을 살펴보고 여기에 적절한 모델을 선택하면 된다! 다양한 머신러닝 모델 1) 서포트 벡터 머신 2) 랜덤 포레스트(decesion tree를 우선으로) 3) 그레이디언트 부스팅 4) 에이다 부스트 등등이 있다. 오늘은 서포트 벡터 모델을 사용해보려한다! 1. 기본 개념 복습하기! 인공지능 - 규칙을 찾는 것 기계학습 - 학습을 하는 것 딥러닝(신경망) - 신경망 방식으로 학습을 하는 것 인공지능은 매우 큰 개념이고 그 안에 기계학습이 있고 그 안에 딥러닝이 있다고 이해하면 쉽다. 기계학습은 (1)회귀(선형, 비선형)과 (2)식별(2개,3개...n개)로 나눌 수 있다. 2. 학습 과정 머신러닝의 학습 과정은 아래의 4가지 단.. 2021. 4. 21.
집값과 경기종합지수의 상관관계_파이썬으로 머신러닝 배우기 파이썬으로 머신러닝 배우기! 먼저 kosis.kr에서 서울의 아파트 매매가, 단독주택매매가, 연립다세대 매매가, 경기종합지수에 대한 데이터를 가져왔다. kosis.kr/index/index.do KOSIS 국가통계포털 첫단어 더보기 끝단어 더보기 자동완성 끄기 자동완성 켜기 자동 추천 기능을 사용해보세요. 검색어 입력시 자동으로 관련어를 추천합니다. kosis.kr 가져온 데이터들은 엑셀에 2015년 10월부터 2021년 2월까지로 정리하였다. 서울의 아파트, 연립다세대, 단독주택의 평균 매매가격이며 아파트 : 전용면적 기준, 규모1) 40㎡이하, 규모2) 40㎡초과~60㎡이하, 규모3) 60㎡초과~85㎡이하, 규모4) 85㎡초과~102㎡이하,규모5) 102㎡초과~135㎡이하, 규모6) 135㎡초과 중에.. 2021. 4. 19.
삼성전자, 현대자동차, LG화학 주가와 KOSPI 주가의 상관 관계 분석_파이썬으로 머신러닝 배우기 파이썬으로 머신러닝 배우기! 이번에는 삼성전자 주가, 현대 자동차 주가, LG화학 주가와 KOSPI 주가의 상관관계를 분석해보려한다. 우선 데이터는 yahoo finance에서 1년치 데이터를 각각 다운받았고 장 마감 금액만으로 분석을 진행하였다. finance.yahoo.com/quote/%5EKS11?p=%5EKS11 KOSPI Composite Index (^KS11) Charts, Data & News - Yahoo Finance Find the latest information on KOSPI Composite Index (^KS11) including data, charts, related news and more from Yahoo Finance finance.yahoo.com 정리한 엑셀파.. 2021. 4. 16.