* Supervised learning (지도학습)
supervised learning은 훈련데이터가 존재하고 그 훈련데이터로 machine learning을 해 predictive model을 만든다. 그리고 그 모델을 이용해 새로 도입되는 데이터가 어떤 class에 속하는지 판단하는 것이다.
모델을 만들때 Training데이터에 기초하여 만들게 된다.
이런 supervised learning의 평가를 위해 주로 교차검증(Cross validation)을 하게 된다.
교차검증은
데이터를
훈련집합(A training set)
검증집합(A validation set)
테스트집합(A test set)
으로 나누고 교차검증을 통해 훈련된 함수에 대해서 정밀도(Precision)과 재현률(recall)을 측정함으로서 훈련성과를 평가 할수 있다.
|
실제 결과(분류) |
||
참(T) |
거짓(F) |
||
추론된 결과(분류) |
참 |
TP(true positve) |
FP(false positive) |
거짓 |
FN(false negative) |
TN(true negative) |
재현률(Recall) = TP/(TP+FN)
*Unsupervised Learning (자율학습)
반면 Unsupervised Learning은 supervised learning과는 다르게 사전정보가 없는것이 특징이다.
이것도 기계학습의 일종으로서 데이터가 어떻게 구성되어 있는지 알아 내는것이다.
Supervised learning 과 reinforcement learning과는 다르게 입력값에 대한 목표치(Label)이 주어지지 않는다.
데이터의 주요특징을 요약하고 설명하는데 사용되는데
예를들면
Clustering, ICA(independent component analysis) 등이 그 예이다.
Cf.
Reinforcement learning 는 unsupervised learning은 아니다. 그런데 이걸 supervised learning이라고도 안하는듯..
별개로 존재한다고 봐야 할것 같다..
'machine learning' 카테고리의 다른 글
bayesian 자료 (0) | 2015.06.27 |
---|---|
deep learning 자료 (0) | 2015.06.25 |
베이지안 이론 (Bayesian Theroy) 이란? (6) | 2014.09.10 |
k-fold cross validation, k겹 교차검증 (2) | 2014.02.03 |
multiclass svm, one vs rest, one vs one (0) | 2014.01.31 |