Intro 이진 분류는 두가지 범주를 갖는 표본을 분류하는 것이다. 분류는 일상 뿐 아니라 여러 산업에서 중요하게 사용되어 왔다. 전통적인 통계 모형인 (MLE를 IRLS로 추정하는) logistics regression부터, 오래 된 머신러닝 기법이지만 여전히 tabular data에서는 건재한 random forest & SVM 그리고 한때 Kaggle을 휩쓸던 강력한 XGBoost를 거쳐, 아직 빛을 보지못한 여러 최신 분류 모델까지... 이번 포스터에서는 이런 방법론에 대한 자세한 이야기를 하기전에 먼저 이진 분류 모델 평가 지표에서 가장 많이 쓰이는 것들 중 하나인 F1 score에 대하여 알아보고자 한다. Comfusion matrix 이진 분류 모델의 결과는 이런 테이블로 정리할 수 있다. ..