<p>뭐 우리나라는 1년 내내 별 시덥지 않은 걸로도 여론조사를 해대는 나라니까...</p><p>필요성이니 뭐니 그런 건 싹 집어치우고...</p><p><br></p><p>응답률, 표본오차, 신뢰수준이란 것에 대해 얘기를 할게요.</p><p><br></p><p>며칠전 TV 뉴스에서 여론조사 결과가 나오는데</p><p>박근혜가 문재인을 조금 앞서고 있다는 결과가 나왔습니다.</p><p>그런데, 표본집단이 1,500명이고 응답률이 15.5%라고 나오더군요.</p><p><br></p><p>이걸 보고 같이 뉴스를 보던 후배가 그러더군요.</p><p>"1,500명에 15.5%면 240명 정도 되는 사람들 얘기를 듣고 저 지랄 하는거야?"</p><p><br></p><p>여러분들도 이렇게 생각하셨나요?</p><p>땡!!!</p><p><br></p><p>응답률이란 건 그런게 아닙니다.</p><p>위 조사에서 표본집단 1,500명에 응답률 15.5%라는 건</p><p>10,000명이 넘는 사람들에게 전화를 했더니</p><p>그 중 15.5%인 1,500명이 대답을 했다는 얘깁니다.</p><p>나머지 9,000명 정도는 그냥 쿨~하게 끊어버리거나 받질 않았던 거죠.</p><p><br></p><p>"그럼 이게 정확한건지 아닌지 알 수가 없는거잖아?"라고 하실 수도 있습니다.</p><p>네, 물론 여론조사라는 건 전국민을 대상으로 하지 않는 이상 절대 정확할 수가 없습니다.</p><p><br></p><p>그래서 표본오차라는게 나옵니다.</p><p>예를 들어 가 후보의 지지율이 45%이고 나 후보의 지지율이 42%일 때,</p><p>표본오차가 ±5%라고 칩시다.</p><p>이건 가 후보는 지지율 45%에서 앞뒤로 5%인 40~50%가 된다는 얘깁니다.</p><p>마찬가지로 나 후보는 37%~47%가 되겠죠.</p><p>결국 두 후보의 지지율이 오차범위 안에서 교집합을 형성하게 되므로</p><p>실질적으로 두 후보간 격차는 거의 없다고 보게 되는 것입니다.</p><p><br></p><p>그러면...</p><p>이런 통계들은 얼마나 믿을만한 것일까요?</p><p>여기서 신뢰수준이란 게 나옵니다.</p><p>이게 정말 중요하고 골 때리는 얘깁니다.</p><p><br></p><p>대부분 95% 신뢰수준이란 말을 쓰는데요...</p><p>표본추출 방식, 설문조사 방식, 질문 방식 등</p><p>지금까지 나온 여러 조사 방법들을 갖고 통계를 내 보니</p><p>우리가 사용한 이런 조사 방법이 95% 정도의 신뢰수준을 갖고 있더라.</p><p>즉, 100번 중 95번 정도가 맞더라는 겁니다.</p><p><br></p><p>종합해보면</p><p>지지율 45%인 가 후보는 약 95%의 확률로 지지율이 40%~50% 구간에 들어오게 되고</p><p>지지율 42%인 나 후보는 약 95%의 확률로 지지율이 37%~47% 구간에 들어오게 된다는 얘깁니다.</p><p><br></p><p>그러나, 여기서 중요한 것 한가지.</p><p>누구도 이 조사 결과가 95% 안에 든 조사인지 5% 안에 든 조사인지는 알 수가 없습니다.</p><p>이게 바로 통계의 맹점이고 함정입니다.</p><p><br></p><p>결론은...</p><p>투표합시다!!!</p>