반응형
predict_proba
는 binary classification에서 인스턴스가 각 클래스에 있을 확률(probability)을 출력하는 것
decision_function
는 나눠진 hyperplane까지의 거리를 찾는 것
예를 들어, SVM classifier는 공간을 분류 결과와 관련된 영역으로 분리하는 hyperplane을 찾음. 포인트가 주어지면 이 함수는 구분 기호까지의 거리를 찾음.
예시로는,
해당 예시는 binary classifiaction으로, 결과가 0, 1로 이루어져 있음.
첫번째 column은 결과 값
두번째 column은 결과가 0으로 나왔을때의 확률 값(predict_proba[0])
세번째 column은 결과가 1로 나왔을때의 확률 값(predict_proba[1])
그래서 2, 3번째 column의 총합은 1이 나와야 함.
네번째는 hyperplane에서 떨어진 거리(decision_function), 1이면 양수, 0이면 음수의 거리 값을 가질 수 있다는 것을 알 수 있다.
확률이 필요없는 경우에는 predict_proba 대신, decision_function를 사용하는 것이 좋다.
반응형
'공부' 카테고리의 다른 글
채널톡 챌린저스 1기 해커톤 (0) | 2023.03.04 |
---|---|
SVM model에서 proba 값의 threshold != 0.5? (0) | 2022.12.28 |
[NLP] 한글 임베딩 (0) | 2022.12.28 |
머신러닝 강의 1편 (1) | 2022.12.21 |
Voting, Bagging, Boosting (0) | 2022.10.28 |