충남심의위가 지적한 부분은 성별 등의 가중치가 빠졌다는 점이었다. P사는 태안에 거주하는 남성과 여성 각각 786명, 368명에게 응답을 받았다. 하지만 이를 인구수에 비례해 할당된 응답자수에 맞게 ‘보정’하는 작업은 거치지 않은 것으로 알려졌다. 표본추출의 과정부터 왜곡돼 결과값의 신뢰성이 떨어진 것이다.
충남 심의위 관계자는 “충남선거관리위 지도과에 이를 넘겼고, 현재 P사 등을 조사하고 있다”고 했다. 충남 선관위는 왜곡의 정도에 따라 검찰 고발을 검토하고 있다.
시간·비용 한계 탓 엉터리 우후죽순
태안군수 여론조사의 사례는 표집오차의 오류에서 비롯된 것이다. 표집오차란 실제 전체가 아닌 일부만 조사해서 통계를 내기 때문에 생길 수 있는 오차다. 실제값에 근접하기 위해서는 표본을 정확하게 추출해야 하는데, 태안군수 여론조사의 사례는 이 부분에서 ‘낙제점’을 받은 것이다.
박민규 고려대 통계학과 교수는 “극단적으로 가중치를 크게 부여했을 경우 동일한 조사를 100번 1000번 반복해 평균을 내면 상관 없지만, 한차례만 해서 공표한다면 오류가 커질 수 있는 함정이 있다”면서 “여론조사에서 10~20% 차이가 나는 게 실제로는 의미가 없을 수도 있다”고 지적했다.
문제는 대다수 여론조사들이 이같은 유혹에서 자유롭지 않다는 점이다. 현실적으로 여론조사는 대부분 한차례 집계뒤 곧바로 공표된다. 신속성을 요하는 여론조사의 특성에다 비용 문제까지 겹쳐서다. 이 과정에서 빠르고 저렴한 ARS 여론조사가 급격히 늘어났다. 실제 전화를 걸어 면접을 하는 방식이 아니라 기계에 녹음된 음성을 돌려 의견을 묻는 방식이다. 이데일리가 지난달 14~30일 선거여론조사공정심의위에 등록된 여론조사 60개를 조사한 결과 ARS의 비중이 81.7%(49개)였다.
ARS 방식은 시간과 비용은 아낄 수 있지만 그 신뢰성은 크게 떨어질 수 있다고 전문가들은 지적한다. “ARS 여론조사는 신뢰성 측면에서 부적격한 방식”(박진우 수원대 통계학과 교수)이라는 의견까지 나올 정도다. 홍형식 한길리서치 소장은 “90년대 후반만 해도 ARS 방식은 여론조사로 인정하지도 않았다”면서 “2000년대 초반 이후부터 우후죽순 생겨났다”고 말했다.
질문지 왜곡한 여론조사 조작 혐의도
질문을 왜곡해 여론조사를 조작하는 사례도 빈번하다. 서울여론조사공정심의위로부터 지난달 21일 제재를 받은 영등포구청장 여론조사 결과가 그런 경우다. 영등포구청장 예비후보 A씨는 지난달 9일 여론조사업체 H사에 직접 의뢰해 나온 결과를 자신의 홈페이지에 게재했다. 결과는 26.5%의 지지율로 A씨 본인이 1위였다.
질문지를 바꾸는 유형은 이외에도 다양하다. 두가지 정책 중 하나를 선택하라는 조사를 실시한다면, ‘A안과 B안 중 하나를 고르라’는 질문지와 ‘새누리당이 주장하는 A안과 새정치연합이 주장하는 B안 중 하나를 고르라’는 질문은 확연히 다르다. 정책 내용에 대한 판단이 아닌 정당지지도에 따른 판단이 반영되는 식으로 왜곡될 수 있기 때문이다.
뿐만 아니라 질문 자체에 대한 이해도가 높아야만 정확한 결론을 낼 수 있음에도 충분한 설명없이 진행하는 경우도 있다. 가령 한·미 자유무역협정(FTA)에 대한 찬반의견을 물을때 FTA 내용을 설명하는 문항이 충분치 않다면, 결과는 정책에 대한 찬반보다는 정책을 시행하는 주체에 대한 지지도 조사로 흐를 가능성이 높다.
이같은 오류는 가중치 등 표본오차 사례보다 가려내는 게 더 어렵다. 계량화할 수 있는 기준이 애매하기 때문이다. 통계학계와 여론조사업계에서는 이를 비표집오차라고 부른다.
영등포구청장 여론조사의 사례는 후보자가 직접 의뢰, 공정성을 이미 잃었다는 점에서 전형적인 선거운동용 여론조사이기도 하다. 박진우 수원대 교수는 “일부러 선거운동을 목적으로 하거나 돈벌이를 위한 여론조사도 많다”며 “여론조사가 순수하게 여론의 흐름을 판단하는 것으로 활용되면 좋은데 너무 오염됐다”고 말했다.
여론조사에서 자주 거론되는 낮은 응답율도 신뢰성 측면에서 문제가 있다는 지적이다. 응답률은 총통화횟수에서 차지하는 비율이기 때문에 표본숫자에는 영향을 미치지 않는다. 그렇지만 응답율 5%가 채 되지 않는 여론조사도 부지기수다. 김미현 알앤서치 소장은 “표본추출만 잘 되면 응답율이 낮다고 해도 큰 문제는 없다”면서도 “그렇더라도 한자릿수 응답률은 문제가 있다”고 말했다.