[Bayesian] 베이즈 추정의 패러독스
몬티홀 문제
세 커튼 A, B, C 중 하나의 커튼 뒤에 자동차가 숨겨져 있다. 그 중 하나를 선택하여 자동차가 뒤에 있다면 상품으로 받을 수 있는 것이다. 당신은 A를 선택했고, 사회자가 B 커튼을 열어보이며 여기에는 자동차가 없다고 얘기했다. 그런 다음 당신에게 바꿀 수 있는 기회를 주었다고 하자. 그러면 C 커튼으로 바꾸어야할까?
이 문제가 패러독스라고 불리는 이유는 그 답이 의외이기 때문인데, ‘다른 커튼으로 선택을 바꿔야한다’는 것이다. 그 이유는 ‘커튼 C 뒤에 자동차가 숨겨져 있을 확률이 A보다 커지기 때문’ 이다. 아마 대부분의 사람들이 커튼 B가 열렸고, 남은 커튼이 2개가 되었으니 확률은 반반이며 어느 것을 선택하더라도 달라지지 않는다고 생각할 것이다. 하지만 여기에는 두 가지 방식으로 생각해볼 수 있다.
- 커튼 A와 커튼 C 중 둘 중 하나가 되더라도, 확률은 반반이다. 따라서 커튼 A에 자동차가 숨겨져 있을 확률은 1/3 에서 1/2 로 상승한다.
- 커튼 B에 자동차가 없다는 사실을 알아도 커튼 A에 자동차가 있을 확률은 달라지지 않는다. 따라서 그 확률은 그대로 1/3 이다. 이것은 커튼 C에 자동차가 있을 확률이 1/3 에서 2/3 로 상승했음을 뜻한다.
여기서 포인트는 양쪽 모두 달라지는가 한쪽만 달라지는가 하는가에 있다. 확률의 정규화 조건에 의하면 B가 소멸됨에 따라 A, C 중 하나는 적어도 확률이 달라져야 한다.
많은 문헌에서는 두 번째 사고법이 옳다고 판단한다. ‘선택자 자신에 대한 확률은 달라지지 않으며, 선택자가 관여하지 않는 측의 확률이 변화한다’ 는 설명이 대다수다.
다음 사례를 한번 보자.
많은 양의 복권 중 한 장을 뽑았다. 그리고 사회자가 남은 방대한 양의 복권 중 한 장만 뺀 나머지는 모두 찢어버리면서 ‘내가 지금까지 찢은 복권 중에는 1등이 없다’고 말했다. 그러면 당신은 남은 한장으로 갈아타야 할까, 아니면 처음 선택한 한 장 그대로 갖고 있어야 할까? 이 상황에서는 갈아타는 것이 유리하다고 생각할 것이다. 왜냐하면 당신이 맨 처음 한장을 뽑은 시점에서는 확률이 상당히 낮기 때문이다. 반대로 사회자가 들고 있던 방대한 양의 복권 중에 1등의 복권이 있을 확률은 압도적으로 클 것이다.
그러나 위에 사례는 몬티홀 문제와는 다른 점이 있는데 그것은 바로 커튼의 수를 극단적으로 늘린 모델이기 때문이다. 그래서 세 커튼 문제와는 다른 모델인 것이다. 결국 몬티홀 문제든 복권 문제든 여기에서 다루는 확률은 주관적인 것이며 과학에 근거하는 입장에서의 정답이란 존재하지 않는다. 왜냐하면 당신이 복권을 고른 시점에서 그 복권이 1등이거나 그렇지 않음은 이미 결정되며, 변화하는 것은 ‘당신의 주관적인 추측치’이기 때문이다.
Reference
- 고지마 히로유키, 『세상에서 가장 쉬운 베이즈통계학 입문』, 지상사 (2017)