EAI는 미래를 꿈꾸는 소중한 자산인 인턴들이 연구원에 대한 소속감과 연대감을 쌓을 수 있는 자리를 마련하고, 교육적 인센티브를 제공하기 위해 월요인턴세미나를 진행하고 있습니다.

 

EAI는 인턴들이 본 인턴 세미나를 통해 좀 더 능동적이고 자율적인 모습으로 연구원 활동에 참여하고 학교 내에서 접할 수 없는 새로운 지식을 습득할 수 있게 되기를 기대합니다. 또한, 내부 커뮤니케이션의 증대, 네트워크 활성화 그리고 배움의 기회를 제공함으로써 연구원과 인턴들간의 장기적 관계 발전 형성에 기여하고자 합니다.

 

발표자

정한울 EAI 여론분석연구팀 수석연구원

 

참석자
김신현, 연세대학교
김태형, New York University
변선영, 고려대학교
송윤희, 연세대학교
신원식, George Washington University
원나영, 숙명여자대학교
이채리, Middlebury College
장유진, Macalester College
조    민, Smith College
주진영, Farragut High School
주창욱, 성균관대학교
Ekaterina Mozhaeva, Georgetown University SFS
Eric Anderson, University of California San Diego


 

 

 


 

내용정리

 

작성자

이채리, 여론분석연구팀 인턴 (Middlebury College)

 

이번 월요인턴세미나에서는 ‘언론의 데이터분석 보도’를 주제로 최근 대통령 지지율에 관한 보도의 문제점과 그에 대한 비판적 분석방법을 알아보았다. 강의는 “데이터 분석 및 보도의 중요성”, “언론에 보도되는 데이터 분석의 현황”, “비판적 리뷰 및 검증 방법”, 그리고 사례 분석, 이렇게 총 4개의 소주제를 중심으로 진행되었다.

 

최근 들어 데이터 분석 보도의 중요성이 높아진 이유는 그가 가진 5개의 특성 때문이다. 첫째, 데이터를 사용한 보도는 시각화되어있다. 이는 직관적 이해를 돕고 가독성을 제고하여 읽는 이의 관심을 유발한다. 둘째, 데이터 보도는 이론화를 통해 인과관계를 보다 쉽게 발견할 수 있게 한다. 이렇게 밝혀진 데이터 사이의 인과관계는 예측 모델을 개발하는데 도움을 준다. 셋째, 이러한 자료는 객관성을 가진다. 객관적인 데이터 자료는 보다 설득력 있는 판단의 근거를 제공한다. 넷째, 데이터 분석의 보도는 파급력이 크다. 이는 생각의 조정을 이끌어내 전략 및 정책의 수정을 유발하기도 한다. 그리고 다섯째, 데이터 분석 보도는 이미 각광받는 트렌드이다. 이제는 빅데이터의 시대라고 불리는 만큼 데이터 분석 보도는 해외의 트렌드가 되었으며, 데이터 사이언티스트는 미래의 가장 촉망받는 직업으로 꼽히기도 한다.

 

그렇다면 이러한 빅데이터는 제대로 분석 및 보도되고 있을까? 뉴스에서 정윤회 사건, 조현아 땅콩회항 사건 등 큰 이슈들을 다룰 때에는 어김없이 빅데이터를 사용한 보도가 나오지만, 그 데이터들이 제대로 분석되어 보도되는지는 의문이다. 데이터의 잘못된 분석과 그 보도는 현 이슈들에 대한 왜곡된 이해를 낳고 종국에는 정책결정에 나쁜 영향을 끼칠 수도 있어 주의가 필요한 실정이다. 이러한 보도들에 속지 않으려면 비판적 리뷰 및 데이터 검증 능력을 갖춰야 한다. 비판적 리뷰 프로세스는 현상에 대한 이해(understanding) → 질문 던지기 → 분석 및 검증(analysis) → 전망과 합의 도출(prediction) 의 순서로 진행된다.

 

먼저 현상에 대한 개괄적 이해를 위해, 분석자는 데이터 분석 결과의 주장파악을 해야 한다. 주장파악은 독립변수 X와 종속변수 Y를 규정하는 방법으로 이루어지며, 이때 X는 현상의 원인이고 Y는 설명되어야 할 현상이다. 이렇게 파악된 주장은 경험적 검증 및 논리와 논거 검증 이 두 가지의 형태로 리뷰될 수 있다. 팩트(fact) 체크를 위한 경험적 검증 시, 다음 세 가지의 항목을 고려해야 한다. 첫째, 데이터가 타당성 있게 측정되었으며 변수 X와 Y가 옳은지 검증해야 한다. 둘째, 데이터 및 측정방법의 신뢰성을 따져보아야 한다. 셋째, 만약 데이터를 보유하고 있을 경우, 실제로 데이터 값을 대입해보는 테스트를 거쳐 데이터 측정 결과가 옳은지 검증해 보아야 한다. 전제와 그에 대한 추론을 바탕으로 이루어지는 논리 및 논거 검증 시, 마찬가지로 총 세 가지 항목이 고려되어야 한다. 첫째, 주장이 참이라는 전제를 바탕으로 가설들을 파생시켜, 그것들이 논거와 일관적인지 확인해야 한다. 둘째, 반대로 주장이 거짓이라는 전제를 세워 이를 바탕으로 누락된 제 3의 변수를 찾아보아야 한다. 셋째, 주장의 전제는 타당한지 그 전제된 가정의 타당성을 검증해야 한다.

 

이러한 이론을 바탕으로 본 세미나에서는 국회법 개정안에 대한 박근혜 대통령의 거부권 행사 이후의 대통령 지지도에 대한 두 가지 여론조사 결과를 사례분석해보며 어떠한 문제점이 있는지 살펴보았다. 우선 2015년 6월 26일에 보도된 리얼미터 조사를 살펴보았다. 이 조사의 독립변수 X(현상의 원인)는 지지층의 결집과 높은 의회 불신이고, 종속변수 Y(설명되어야 할 현상)는 6월 25일 대통령의 거부권 행사 이후 급상승한 대통령의 지지율이다. 둘째로 같은 주제에 대해 다른 결과를 내놓은 갤럽조사 보도를 분석하였다. 이 조사의 독립변수 X는 메르스 위기의 긍정적 국면 전환과 거부권 행사를 둘러싼 엇갈린 평가(지지층의 결집, 비지지층의 비판) 이고, 종속변수 Y는 대통령 지지율의 답보이다.

 

이 두 조사의 타당성을 입증하려면 “지지율이 올라갔다”라는 단순 명제에서 또 다른 전제와 추론을 이끌어내어 그것을 검증해야 한다는 것을 앞서 배웠다. 그렇다면 “지지율이 올라갔다”라는 종속변수의 독립변수인 “지지층의 결집”과 이 주장에서 파생되는 논리들이 옳은지 검증해 보아야 한다. 두 조사의 핵심 논리인 “대통령의 지지층이 결집하여 지지율이 상승했다”는, 반대로 비지지층은 대통령의 결정에 반대하여 그들의 지지율은 하락한 것이 보여야만 성립한다. 그런데 리얼미터 조사에 따르면, 거부권 행사 직후 대구 경북, 50대, 새누리당 지지층, 그리고 보수층 등 전형적인 대통령의 지지층뿐만 아니라 전국적, 전 연령층에서 모두 지지율이 상승한 것으로 나타났다. 대통령의 지지율 상승의 원인이 “지지층의 결집”이 아닌 것이다.

 

진보와 보수, 연령과 지역 상관없이 모두 지지율이 올라갔다는 것은 결국 지지층/ 비지지층에 따라 찬반이 엇갈리지 않는 변수인 “합의 이슈”에서 변화가 있었다는 뜻이다. 즉 25일 지지율이 상승하기 전까지 지지율을 하락시키고 있던 제 3의 변수이자 합의 이슈인 메르스 사태의 국면 변화를 고려해야 하는 것이다. 갤럽조사 보도는 소강상태에 접어든 메르스 사태를 지지율 상승의 한 원인으로 분석하는 등 리얼미터 조사보다는 타당한 분석을 제시했다. 그렇지만 이 조사 역시 비지지층의 상승한 지지율을 고려하지 못한 채 “비지지층은 (대통령의 국회법 개정안에 대한 거부권 행사를) 소통 미흡과 독단으로 달리 보아 부정평가에서의 ‘소통 미흡’, ‘독선, 독단적’, ‘국정운영 부진’, ‘당청 또는 여야 갈등’ 지적이 증가했다”라고 평가했다. 본 세미나에서는 갤럽조사의 이 당시 지지층 / 비지지층별 지지율 데이터를 분석하지 않았지만, 그 자료의 비지지층 지지율을 분석해본다면 갤럽조사의 분석이 타당한지 여부를 판단할 수 있을 것이다.

 

우리는 여론분석기관이나 뉴스에서 발표하는 데이터 조사 결과를 맹신하는 경향이 있다. 하지만 아무리 권위 있는 기관에서 도출해낸 결론이라 하더라도 논리의 허점은 있을 수 있다. 이를 잊지 말고 무분별하게 쇄도하는 데이터 분석 보도를 비판적 시각과 논리적 검증의 역량을 지니고 바라보아야 한다. 위 비판적 리뷰의 결론인 “합의 이슈, 즉 메르스 사태의 소강이 진보 및 보수 진영을 아우르는 대통령 지지율의 상승을 이끌어 냈다” 역시 온전히 옳은 결론이 아닐 수도 있다. 보건복지부 통계에 따르면, 메르스 확진 환자 추이는 이미 6월 25일보다 훨씬 앞선 6월 7일 정점을 찍은 후 확연한 소강상태에 접어들었고, 치료중인 환자 수(누계) 또한 6월 17일 이후부터 급격하게 하락하고 있다. 메르스의 진정세가 6월 25일 전후에 새삼스러운 게 아닌 만큼, 이는 그 시기까지 하락하던 대통령 지지율의 급반등을 설명하기에는 충분치 않을 수도 있다는 것이다.

 

복잡한 사회 현상은 한두 가지의 변수로 설명이 되지 않는 만큼, 언론은 데이터 분석 보도를 할 때 신중을 기해야 하고, 그것을 읽는 독자들은 더욱 비판적인 사고를 지녀야 한다는 것을 생각하게 하는 세미나였다.