Linux Programmer

통계가 전하는 거짓말 본문

독서 관련/역사 철학 기타

통계가 전하는 거짓말

sunyzero 2011. 5. 23. 02:43

통계가 전하는 거짓말



통계가전하는거짓말우리는날마다숫자에속으며산다
카테고리 정치/사회 > 사회학 > 사회학일반 > 사회비평에세이
지은이 정남구 (시대의창, 2008년)
상세보기

내가 좋아하는 명언중에 영국 수상이었던 벤자민 디스라일리가 말한 "There are three kinds of lies: lies, damned lies, and statistics"라는 말이 있다. 통계란 어떻게 보여주느냐에 따라서 다양한 거짓말을 할 수 있기 때문이다.

실제로 통계를 가지고 거짓말을 꾸미는 예로 책의 맨 앞장에 재밌는 유머 하나가 있어서 소개해본다.

수학자, 회계사 그리고 경제학자가 같은 일자리에 지원해 면접을 보러갔다.
면접관은 먼저 수학자를 불러 물었다.

"2 더하기 2는 몇입니까?"
"4입니다."

면접관이 다시 물었다.

"정확히 4가 맞습니까?"

수학자는 면접관을 의심스런 눈으로 쳐다보며 말했다.

"예, 정확히 4입니다."

면접관은 다음으로 회계사를 불러 같은 질문을 했다. 회계사는 대답했다.

"4입니다. 10퍼센트씩 증감이 있다고 보고 계산해도 평균 4입니다."

면접관은 경제학자를 불러서 같은 질문을 했다. 그러자 경제학자는 자리에서 일어나 문을 잠그고 블라인드를 내리고는 면접관 옆자리에 바짝 붙어 앉아 이렇게 말했다.
"몇이길 바라십니까?" 


사실 이 유머의 원본은 오래된 유머인데, 이 책에서 볼 줄은 몰랐다.

{원문}


이렇듯이 통계는 얼마든지 관점에 따라서 다르게 해석할 수 있는 요지가 있다. 실제로 많은 통계수치는 화자의 목적에 따라서 표준편차를 생략한 평균값, 분포의 인터벌 조정, 퍼센트로 환산한 눈속임등으로 사용된다.

폴 크루그먼의 "경제학의 향연" 후기에서도 언급했지만, 사장을 포함하여 100명의 노동자가 있는 기업의 평균연봉이 1억이지만, 사장의 연봉이 50억이라면? 그럼 사장을 제외한 나머지 99명의 노동자의 평균연봉은 얼마일까? 정답은 5050만원이다. 평균연봉이 딱 반이 되어버리는 셈이다.

따라서 평균(average)를 이야기 할 때는 꼭 표준편차(standard deviation)와 중간값이 필요하다. 표준편차, 중간값을 교묘하게 생략했다면 왜곡의 목적이 숨어있는 것이다.

또한 비슷하게 분포의 인터벌을 조정해서 그래프 모양도 얼마든지 속일 수 있다. 예로 누적수치를 표시할 때 원하는 모양이 나오지 않는다면 기간을 조정하면 된다. 예를 들어 1960~2000년까지의 그래프와 1980~2010까지의 누적 수치의 그래프 모양은 완전히 다를 수 있기 때문이다.

결론적으로 숫자에 속지 않으려면 다양한 생각, 때로는 위험할 정도로 차가운 생각을 해야 할 필요가 있다. 감정에 휩쓸리거나 숫자나 구호에 현혹되면 중요한 본질을 잊어버리거나 인지부조화에 빠질 수 있다. 자신이 가진 생각이나 신념에 위배되더라도 최대한 다른 방향에서 바라보도록 노력하는 것이 중요하다.

새빨간거짓말통계 상세보기

비슷한 책으로서 "새빨간 거짓말 통계"라는 책도 있다.


반응형
Comments