로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

Power of Analysis

평균으로의 회귀 vs. 도박사의 오류, 숫자로 가득한 세상, 확률을 이해하라

김진호 | 167호 (2014년 12월 Issue 2)

Article at a Glance – 혁신, 자기계발

 

주사위를 던졌는데 다섯 번 연속 홀수가 나왔다면 사람들은 이제 짝수가 나올 차례라고 생각한다. 최근에 안 나온 숫자일수록 이번에는 나올 확률이 높다고 판단하는도박사의 오류. 물론 주사위를 던졌을 때 짝수 또는 홀수가 나올 확률은 각각 2분의 1이다. 이는 수없이 많이 주사위를 던져 확인한 결과다. 10만 번, 20만 번쯤 던지면 짝수와 홀수가 나오는 비율이 비슷해지겠지만 그 많은 시도 중에 일부는 홀수 또는 짝수만 연속적으로 등장하는 일이 얼마든지 가능하다. 여섯 번째에도 홀수가 나올 확률이 여전히 2분의 1이라는 의미기도 하다. 이 밖에도 사람들이 오류를 범하는 확률적 개념에는평균으로의 회귀’ ‘유용성의 오류등이 있다.

 

 

확률의 함정

 

일기예보, 로또, 질병, 사고, 보험 등 일상생활에서 일어나는 많은 현상이 모두 확률과 관계가 있다. 신문과 방송에는 로또 1등 명당, 머피의 법칙, 위성 발사가 성공할 확률, 흡연자가 폐암에 걸릴 확률 등 확률과 관련된 숫자, 용어, 정보 등이 끊임없이 등장한다. 프랑스 수학자인 라플라스가 인생에서 가장 중요한 문제들은 대부분 확률적 선택의 문제라고 한 것처럼 확률은 우리 생활 깊숙이 자리 잡고 있다. 문제는 확률에 대한 사람들의 이해가 매우 낮다는 것이다. 확률이 낯설게 느껴지는 이유 중 하나는 확률이 사람들의 직관과 크게 다른 경우가 많기 때문일 것이다. 두 사람의 생일이 같을 경우를 예를 들어보자. 1년을 365일이라고 할 때 만약 366명의 사람들이 모여 있다면 그 집단에서 적어도 두 사람은 틀림없이 100%의 확률로 생일이 같다. 그런데 이 확률이 100%가 아니고 50%라면 어떨까? 즉 생일이 같은 사람이 적어도 두 사람일 확률이 50%가 되기 위해선 이 집단에 몇 명이 있어야 할까? 사람들은 직관적으로 366명의 2분의 1 183명이라고 생각하기 쉽다. 하지만 정답은 놀랍게도 단지 23명이다. 다시 말하면 아무렇게나 모인 23명 중에서 적어도 두 사람이 생일이 같을 확률이 50%인 것이다. 이를 쉽게 풀어 보면 다음과 같다.1

 

 

K 명에 따른 확률을 정리하면 아래의 표와 같다.

 

 

표에서 볼 수 있듯 생일이 같은 사람이 적어도 두 사람일 확률이 50%가 되기 위해서는 이 집단에 23명만 있으면 된다. 집단에 40명이 있다면 거의(90%) 생일이 같은 사람이 있다. 우리나라 초등학교의 학생 수가 25명 전후인 지역에서는 평균적으로 두 학급마다 생일이 같은 학생이 있는 것이며 학생 수가 40명 전후라면 거의(90%) 모든 반에 생일이 같은 학생이 있다는 의미다. 따라서 반에 생일이 같은 학생이 있다는 것은 놀랄 만한 인연이 아니라 자연스럽게 일어나는 현상이다.

 

우리나라의 로또는 1부터 45까지의 숫자 중에 6개의 숫자를 뽑는다. 로또를 사려는데 자칭 로또 전문가라고 하는 친구가과거 로또에서 15라는 숫자가 한 번도 1등 번호에 나온 적이 없으니 이번에는 꼭 15를 찍어라고 충고했다면 그의 충고를 들어야 할까? 심지어 인터넷에는 로또 1등에 당첨될 번호를 알려준다는 유료 사이트도 많다. 이 사이트들은 과학적 로또 당첨번호 시스템이니, 통계적 패턴 분석이니 하는 말들로 선전하며 사이트에 가입해서 1등 예상번호를 받으라고 유혹한다. 하지만 과거 로또에서 어떤 숫자가 많이 나왔든, 혹은 적게 나왔든 45개의 숫자 중에 어느 한 숫자가 뽑힐 확률은 동일하다. 유료 사이트들에서 광고하는 내용이야말로 확률에서 나타나는 대표적 오류다. 사람들은 최근에 안 나온 숫자가 이번에는 나올 확률이 높다고 판단하는데 이를도박사의 오류라고 한다.

 

도박사의 오류

얼마 전 TV에서 부산 딸부잣집 부부와 일곱 명의 딸이 출연한 프로그램을 본 적이 있다. 프로그램 중간에 사회자가어쩌다 딸만 일곱을 낳았습니까라고 묻자 어머니가 이렇게 답했다. “딸을 셋 낳으니 사람들이딸 셋을 잇달아 낳으면 다음 아이는 틀림없이 아들이라고 하기에 낳았더니 또 딸이더라.” 방청객들은 큰 웃음을 터뜨렸다. 이 말에는 간단히 웃어넘길 수 없는 확률적 오류가 있다. 어느 경우에나 아들을 낳을 확률은 2분의 1이다. 새로 태어날 아기는 그전에 언니들이 줄줄이 있었는지를 알지 못한다. 따라서 잇달아 딸 다섯을 낳았거나 아들을 다섯 낳았더라도 다음에 아들 또는 딸을 낳을 확률은 여전히 2분의 1이다. 하지만 사람들은 딸을 셋 잇달아 낳으면 다음에 아들을 낳을 확률이 2분의 1보다 높아진다고 생각한다. 이것 역시도박사의 오류에 해당한다.

 

카지노에는 룰렛(roulette)이라는 게임이 있다. 0에서 36까지 숫자가 적힌 원판을 돌리면서 그 위에 구슬을 떨어뜨린 뒤 구슬이 어떤 숫자에서 멈추는지를 맞추는 게임이다. 사람들은 다양한 방법으로 숫자에 돈을 건다. 만약 숫자를 맞추면 정해진 배당을 받는다. 대부분의 도박사들은, 예컨대 여섯 번 연속 홀수가 나왔으면 다음에는 틀림없이 짝수가 나올 것이라고 생각하면서 짝수에 상당한 돈을 건다. 이처럼 앞서서 홀수가 여러 번 나왔을 때 다음번에 짝수가 나올 확률이 2분의 1보다 높아질 것으로 생각하는 것이 바로 도박사의 오류다. 룰렛의 구슬은 앞에서 어떤 숫자가 나왔는지 전혀 기억하지 못하는데 도박사들은 구슬이 그 숫자들을 기억할 것이라고 기대하는 오류를 범한다. 도박사들의 기대와는 관계없이 어떤 경우에도 다음에 홀수가 나올 확률은 2분의 1이다. 그러나 사람들은 이런 판단이 잘못된 것이라고 생각하지 않고 여전히 자신의 생각을 고집할 때가 많다. 소설가로 유명한 에드가 포(Edgar Poe)는 주사위 게임에서 2가 연속 다섯 번 나왔다면 여섯 번째 시도에서 2가 나올 확률이 6분의 1보다 작을 것이라는 주장을 끝내 꺾지 않았다.

 

 

1차 세계대전 중에 실제로 있었던 일이다. 전쟁터에서 포탄이 떨어질 때 병사들은 새로 만들어진 포탄구덩이, 즉 방금 포탄이 떨어진 장소에 몸을 숨기라는 교육을 받았다. 아마도 같은 날 같은 장소에 두 번이나 포탄이 떨어질 가능성이 거의 없다고 생각한 교육이었을 것이다. 그러나 이것 역시 도박사의 오류와 유사한 오류다. 동전을 던져 앞면이 나왔다는 사실이 다시 동전을 던졌을 때 앞면이 나올 확률을 낮게 하지 않는다. 마찬가지로 어느 지점에 포탄이 떨어졌다는 사실이 다시 그 지점에 포탄이 떨어질 확률을 낮춰주지 않는다. 그래도 포탄자리에 몸을 숨기는 것이 안전하다고 생각하는 사람들을 위해 간단한 예를 들어보자. 항아리에 1에서 20까지 새겨진 스무 개의 공이 있다고 하자. 그 항아리에서 7이 적힌 공을 꺼낼 확률은 20분의 1이다. 항아리에서 공을 두 번 꺼낸다고 할 때(한 번 꺼낸 공은 다시 항아리에 넣음) 두 번 모두 7이 적힌 공을 꺼낼 확률은 1/20x1/20, 1/400이다. 같은 공을 두 번 연속해서 꺼낼 확률은 한 번 꺼낼 확률보다 매우 작다. 처음 꺼낸 공이 7이라는 것을 알더라도 그 다음에 7이 적힌 공을 꺼낼 확률은 여전히 20분의 1이다. 어느 한 지점에 포탄이 떨어진 것을 알더라도 그 자리에 포탄이 다시 떨어질 확률은 다른 곳에 포탄이 떨어질 확률과 여전히 같은 것도 이런 이치다.

 

가입하면 무료

인기기사

질문, 답변, 연관 아티클 확인까지 한번에! 경제〮경영 관련 질문은 AskBiz에게 물어보세요. 오늘은 무엇을 도와드릴까요?

Click!