[김범준의 세상물정] ‘사전 득표율’과 조건부 확률
상태바
[김범준의 세상물정] ‘사전 득표율’과 조건부 확률
  • 김범준 편집위원(성균관대 교수)
  • 승인 2020.04.28 11:00
  • 댓글 0
이 기사를 공유합니다

중앙선거관리위원회 '개표절차' 영상 갈무리.
중앙선거관리위원회 '개표절차' 영상 갈무리.

21대 국회의원 선거가 끝났다. 관심을 끈 중요한 선거가 끝나면 자주 그렇듯이 투표결과가 조작되었다는 주장들이 있었다. 그 중 필자의 주목을 끈 것이 바로, 특정 정당 후보의 사전 득표율이 선거 당일의 득표율보다 상당히 많은 지역에서 10%정도 더 높았고, 이는 통계적으로 불가능에 가까운 사건이라는 주장이었다. 상당히 흥미로운 문제라는 생각이 들었다.

◆ ‘독립 사건’이 함께 일어날 확률은?

우리말 속담에 “까마귀 날자 배 떨어진다”라는 것이 있다. 까마귀가 날아오르는 것과 배가 떨어지는 것이 서로 관계가 없는 사건이라는 뜻이다. 통계학에서는 이처럼 서로 관계없는 독립적인 사건을 독립사건이라고 한다.

독립인 사건이 동시에 함께 일어날 확률은 계산이 정말 쉽다. 그냥 두 사건이 일어날 확률을 곱하면 된다. 주사위를 던져서 2의 눈이 나올 확률은 6분의 1이고, 동전을 던져서 앞면이 나올 확률은 2분의 1이다. 주사위와 동전을 함께 던졌을 때 주사위의 2의 눈과 동전 앞면이 관찰될 확률은 두 확률의 곱인 12분의 1이다. 두 사건이 독립이기 때문이다.

자, 투표 인구가 100명인 동네에 특정 정당 A의 후보에게 투표한 사람이 60명, 다른 후보에게 투표한 사람이 40명이라고 해보자. 여기에 100명의 주민들 중 30명이 사전 투표를, 70명은 당일 투표에 참여했다고 또 가정해보자.

사전 투표와 당일 투표결과를 모두 모으면 특정 정당 후보는 100표 중 60표를 얻어서 득표율 60%로 당선된다. 어느 후보를 지지하는지와 무관하게 사전투표를 할지, 당일 투표를 할지를 사람들이 결정했다면, A 정당 후보의 사전 득표율은 어떻게 계산될까?

두 사건이 독립이라는 가정이므로 두 사건의 확률을 곱하면 0.6*0.3 = 0.18이 된다. 모두 100명이 투표를 했으니, 100*0.18 = 18표가 사전 득표이고, 사전 투표에 참여한 사람이 30명이므로, 이 후보의 사전 득표율은 18/30 = 60%가 되어서, 최종 득표율 60%와 같다. 현실에서도 마찬가지로 사전 득표율과 최종 득표율의 차이가 거의 없었다면, 우리는 지지 후보와 사전/당일 투표의 결정이 독립사건이라는 결론을 얻을 수 있다.

중앙선거관리위원회 '개표절차' 영상 갈무리.
중앙선거관리위원회 '개표절차' 영상 갈무리.

만약 현실에서, A 정당 후보의 사전 득표율이 60%가 아닌 70%라면, 사전 투표 30표 중 이 후보가 21표(=30*0.7)를 얻었다는 뜻이다. 앞에서 독립사건을 가정해서 구한 18표와 다르니, 지지 후보에 따라 사전 투표를 할지 당일 투표를 할지, 그 비율이 달랐거나, 두 사건이 독립임에도 이런 결과가 나왔으니 선거결과가 이상하다는, 두 종류의 다른 이야기를 할 수 있다.

먼저 첫번째 경우, 지지정당과 사전투표 참여가 독립사건이 아닌 경우를 살펴보자. 이 정당 후보자를 지지한 사람 중 사전 투표에 참여한 사람의 비율은 얼마일까? 모두 60명의 A 정당 후보 지지자 중 21명이 사전투표에, 나머지 39명이 당일 투표에 참여했으며, 40명의 타 정당 후보 지지자는 9명이 사전투표에, 나머지 31명이 당일 투표에 참여했다.

따라서, A 정당 후보를 지지하는 사람들은 사전투표에 35%(=21/60), 당일투표에 65%(=39/60) 참여했고, 타 정당 후보 지지자는 사전/당일 투표에 각각 22.5%(=9/40)와 77.5%(=31/4)가 참여했다는 결론을 얻는다. 사전 득표율 70%와 최종 득표율 60%의 차이를, 지지정당이 어디냐에 따라 사전 투표, 당일 투표로 지지자가 나뉜 패턴이 많이 달랐다는 것으로 쉽게 설명할 수 있다.

◆ ‘조건부 확률’을 이용해보면…

관심 있는 독자를 위해 조건부 확률을 이용한 계산을 약간의 수식으로 소개해보자. A 정당 후보를 지지하는 사건을 A, 사전 투표에 참여하는 사건을 B라 하자. 사건 A와 사건 B가 동시에 발생할 확률을 P(A,B)라 적자.

앞에서 살펴본 것처럼 전체 100명 중 사전 투표에서 A 정당 후보를 지지한 사람이 21명이므로, P(A,B) = 0.21이다. 고등학교 수학의 조건부 확률을 이용하면 P(A,B) = P(A)*P(B|A)가 된다. 여기서 조건부 확률 P(B|A)가 바로 A 정당 지지자가 사전 투표에 참여할 확률이 된다.

위 식을 정리하면 P(B|A) = P(A,B)/P(A) = 0.21/0.6 = 0.35로 위에서 설명한 A 정당 지지자의 사전 투표 참여율 35%에 해당한다. 타 정당 지지자 중 당일 투표 참여율의 계산도 어렵지 않게 할 수 있다. 관심 있는 독자는 한번 연습 문제로 풀어보시길.

위의 계산은 선거조작이 없었다는 것을 증명하는 것은 물론 아니다. 다음에는, 선거 조작이 있었는데, 아무도 그 사실을 모르는 경우를 살펴보자.

만약 전국에 투표 감시인이 1000명이고, 이들 각자가 선거 조작을 2분의 1의 확률로 적발해낼 수 있다고 가정하면, 이들 모든 투표 감시인이 속아 넘어가 조작을 눈치 채지 못할 확률은 2분의 1의 1000승이다. 동전을 1000개 던졌더니 단 한번의 예외 없이 모두 앞면이 나올 확률과 같다. 거의 불가능에 가까운 작은 확률이다.(물론 감시인의 부정 적발이라는 사건이 모두 서로 독립이라는 가정이 필요하다.)

지지정당에 따라 사전투표 참여율이 많이 달랐다는 것과 많은 감시인을 모두 속이는 것 중 어떤 것이 더 개연성이 있을 지는 사람마다 판단이 다를 수 있다. 하지만, 독립사건일 때 예상되는 사전 득표율 60%와 실제 측정된 사전 득표율 70%의 차이의 이유를 통계학을 가르치는 수업에서 연습문제로 물었을 때, 조건부 확률을 이용해 답한 답안과 선거조작이 이유라고 답한 답안 중, 필자가 어떤 답안에 점수를 줄지는 분명하다. P(B|A)가 P(B)와 같다는 가정은 아무 근거가 없다.

 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사