분류 성능 지표 제대로 알고 넘어가기 (정분류율, 특이도, 민감도, 재현율, F1 score, 정확도 등)
데이터 마이닝 "분류 성능 지표" 제대로 알고 넘어가기 머신 러닝 알고리즘이나 딥러닝 모델을 활용하여 예측 모델을 만들었을 때, 모델의 성능을 평가(검증)하기 위해 활용하는 다양한 지표가 존재합니다. 결국 "모델이 잘 만들어졌는가"를 확인하기 위한 지표이므로 대체로 유사해보이지만, 모델의 형태나 예측 목적에 따라 적절한 지표를 사용해야 합니다. 자주 사용하지만, 사용할 때마다 잊어 다시 확인하곤 하기에, 이번 기회에 개념을 다시 한 번 짚고 넘어가려 합니다. 개념 확립에 앞서, 이해를 돕기 위한 심플한 예제를 정하겠습니다. - 환자의 병원 전자의무기록(EMR) 데이터를 이용해 골다공증 여부를 예측하는 모형을 생성함. 골다공증: Positive(1) 정상: Normal(0) I. 분류 성능 지표 Matri..
2021. 5. 8.