[미디어 리터러시 셀프 체크] 데이터에 숨은 함정을 찾자

2023. 4. 10. 10:26언론진흥재단 소식

 

written by. 계간 <미디어리터러시> 편집부


 

 

뉴스 기사를 통해 자주 보게 되는 ‘숫자’

가장 객관적인 정보라 생각되지만, 우리의 믿음을 배신하는 경우도 있습니다.

 

 

 

 

그렇다면 과연 어떤 함정이 우리 주변에 있는지,

<미디어리터러시>와 함께 알아볼까요?

 

 

 

 

 

 

 

포털 등에서 기사를 검색하면

잘못됐거나 의도가 숨어 있는 것으로 보이는 잘못된 데이터 시각화 자료를 다수 발견할 수 있습니다.

 

 

 

예를 들어 봅시다.

 

 

A 집단과 B 집단의 연평균 소득이 각각 2,500만 원과 3,000만 원이라고 가정해 봅시다.

그렇다면 이들의 실제 비율은 1대 1.2로, 후자가 전자에 비해 20% 큽니다.

 

 

 

​그런데 막대그래프 Y축 시작점을 2,000만원으로 하면 자료가 주는 인상이 달라집니다.

B집단의 연평균 소득이 A집단에 비해 두 배는 커 보이는 것입니다.

 

 

이렇게 세로축에 조작을 가해 데이터를 있는 그대로가 아닌 다르게 보이도록 만드는 것을 ‘Y축 해킹’이라고 합니다.

거의 ‘데이터 마사지’에 가까운 행동인데요.

 

 

 

 

 

 

 

만약 이러한 그래프가 기사 속에 들어가 있을 시,

독자는 Y축이 어디서부터 시작하는지 세심하게 눈여겨보기보다는

막대 길이를 비교하는 선에서 그칠 가능성이 높습니다.

 

그러면 정보가 실제보다 조금 더 자극적으로 변질되죠.

 

 

그 외에도 분모에 대한 정확한 정의 없이 분자를 비교하는 경우,

편향된 표본을 가지고 조사한 경우 등 다양한 사례가 있습니다.

 

 

 

 

 

 

 

 

데이터에 대한 대중의 인식이 높아져야 하는 이유,

바로 확증 편향 때문도 있는데요.

 

확증 편향(confirmation bias), 많이 들어본 단어죠?

 

스스로의 믿음을 반박하는 증거는 무시하고, 지지하는 증거만을 받아들이려 하는 인지적 편향을 뜻하는데요.

 

확증 편향에 빠진 사람은

관련 증거를 충분히 수집하고 합리적으로 검토하기보다는, 자신의 주장을 뒷받침하는 증거만을 취사선택하여 받아들입니다.

 

 

 

 

 

 

 

 

데이터를 볼 때도 확증 편향을 경계해야 올바른 해석이 가능합니다.

 

데이터 뒤에 언제나 어떠한 의도가 숨어 있다고 말하기는 힘들지만,

수용자는 그에 상관없이 언제나 경계할 필요가 있습니다.

 

 


 

 

 

데이터 리터러시는 양적 자료라는 특성으로 인해 다른 종류의 미디어 리터러시보다 특수한 접근이 필요합니다.

 

이를테면 기초 통계 교육, 인과 추론에 대한 이해 등이 필요한데요.

 

천리 길도 한 걸음!

 

일단은 Y축을 유심히 보는 것으로 시작할 수 있겠습니다.

 

 

 

 

참고문헌
박준석, 통계·그래프의 숨겨진 진실 찾아내는 ‘데이터 리터러시’
https://blog.naver.com/kpf11/222697730327