교차검증1 k-fold cross validation, k겹 교차검증 machine learning을 할때 사용자가 가지는 데이터는 오직 훈련집합(Training set) 과 테스트집합(Test set) 뿐이다. 집합내에 샘플의 수가 굉장히 많다면 물론 좋겠지만, 실제상황에서 샘플수가 무한정 제공 될 수는 없다. 따라서 데이터의 양이 충분치 않을 때, 분류기 성능측정의 통계적 신뢰도를 높이기 위해서 쓰는 방법이 재샘플링(resampling) 기법을 사용하는데 대표적인 방법으로는 k-fold cross validation 과 bootstrap가 있다. 지금은 cross validation , 교차검증 법을 알아보자... 총 N개의 sample이 있다면 이 분류기의 성능은 어떻게 정의 할 수 있을 것인가? 샘플을 k로의 집단으로 나눈다(이때, 각 집단의 mean은 비슷할 수 .. 2014. 2. 3. 이전 1 다음