로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

평균은 같지만 흩어진 정도가 다른 두 그룹

174호 (2015년 4월 Issue 1)

김진호 김진호
김진호
-서울과학종합대학원 빅데이터 MBA 주임교수
jhkim6@assist.ac.kr
평균은 같지만 흩어진 정도가 다른 두 그룹

‘평균’은 흔하게 사용되는 통계적 개념이라 많은 사람들에게 익숙하지만 사실 평균에는 산술평균, 중앙값, 최빈수 등 다양한 종류가 존재하기 때문에 맥락과 용도에 맞게 구별해 사용하지 않으면 큰 오해를 낳기 쉽다. 평균을 선택할 때 가장 먼저 고려해야 할 것은 데이터의 특성이다. 명명척도로 수집된 데이터인지, 서열척도로 수집된 데이터인지에 따라 적합한 평균이 달라진다. 데이터의 분포도 고려해야 한다. 종모양분포를 이룬 데이터가 아니라면 일반적으로 사용되는 산술평균이 적합하지 않을 수 있다. 마지막으로 평균을 사용하는 목적을 생각해야 한다. 선택한 평균에서 유도되는 결론이 무엇인지, 그 결론이 데이터를 곡해하지는 않는지를 주의 깊게 살펴야 한다.