로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

분류표

232호 (2017년 9월 Issue 1)

최용주 최용주
최용주
서울과학종합대학원(aSSIST) 부총장
yjc@assist.ac.kr
김진호 김진호
김진호
-서울과학종합대학원 빅데이터 MBA 주임교수
jhkim6@assist.ac.kr
분류표

모형의 유용성은 <표 5> 같은 분류표(classification table)로 설명된다.

<표 5>에서 가로축은 회원의 현재 상태, 즉 해지 상태인 1만9609명과 유지 상태인 2만5333명을 나타낸다. 세로축은 모델이 해지 혹은 유지라고 예측한 것이다. 해지 상태인 1만9609명의 고객에 대해서 모델은 1만5664명을 해지할 것으로 예측했지만 3945명은 유지 상태로 잘못 예측하고 있다. 또한 유지 상태인 2만5333명의 고객에 대해 모델은 2만2459명을 유지라고 올바로 예측했지만 2874명은 해지 상태로 잘못 예측하고 있다.

모델의 정확도(accuracy), 즉 올바르게 예측한 비율은 84.8%로 높은 편이라고 할 수 있다. 이 비율은 표에서 대각선의 비율인 ‘(1만5664+2만2459)/4만4942’를 계산한 것이다. 모델 예측력에서 더욱 중요한 것은 모델 개발의 목적인 해지 고객을 해지상태라고 제대로 식별하는 데 있다. 따라서 모델의 정확도 외에도 해지 회원을 해지라고 정확히 예측하는 재현율(recall)도 평가해야 한다. <표 5>에서 재현율은 해지 고객(1만9609)을 해지라고 정확히 예측한(1만5664) 비율인 79.9%다(1만5664/1만9609). 이 모델은 정확도가 84.8%이고 재현율도 약 80%이므로 좋은 모델이라고 할 수 있다.

 참고로 이 데이터에 인공신경망 모델을 적용했더니 정확도는 77.8%, 재현율은 67.1%로 나타나서 로지스틱 회귀분석 모델보다는 못한 결과가 나왔다.