먼저 기본 개념

T/N : 예측이 실제와 비교해 맞냐 / 틀렸냐 여부, P/F : 그럴 것이다 / 아닐 것이다 둘 중 어느 예측을 내렸는지

TP: True Positive 실제 ~일 것(Positive)이라고 예측해서 예측이 실제로 맞은 것(True)

**TN: True Negative for ~ ~**가 아닐 것(Negative)이라고 예측해서 예측이 실제로 맞은 것(True) 실제 값과 예측 값이 모두 Negative인 경우인 것인데 다중분류에서는 직접적으로 구할 수 없다고 한다 그래서 보통 전체에서 TP와 FP, FN를 뺀 값으로 구하는 것 같기도하다

FP: False Positive for ~ ~일 것(Positive)이라고 예측해서 예측이 실제로는 틀린 것(False)

FN: False Negative for ~

~가 아닐 것(Negative)이라고 예측해서 예측이 실제로는 틀린 것(False)

velog

주로 참고한 내용

[ML] 다중 분류의 평가 지표

머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정 3판): 6.5.4 다중 분류의 성능 지표

머신러닝 다중 분류 모델 성능평가에서 f1, recall, roc_auc 사용하기

sklearn.metrics.precision_recall_fscore_support

정밀도, 재현율, f1스코어까지 한번에 해주는 것