포럼

‘세상을 바꾸는 데이터’ 바로 읽기

다독다독 (多讀多讀) 2023. 5. 19. 16:54

2023 ‘데이터·리터러시·저널리즘 콘퍼런스’ 교사연수

written by. 배기연 (부산 개성고 교사)

 

 

한국언론진흥재단은 서울대 빅데이터 혁신공유대학 사업단과 공동으로 2월 22일부터 24일까지
<2023 데이터·리터러시·저널리즘 콘퍼런스>를 개최했다.
‘데이터의 힘, 사람의 힘’이라는 주제로 열린 이번 콘퍼런스는
챗GPT 등 우리 생활 속에 성큼 들어온 데이터 활용 기술과 데이터에 대해 이해해보는 소중한 자리였다.

 

권혜진 대표는 데이터 저널리스트에게는 데이터가 취재원이라고 강조했다. 즉 같은 정보라도 관점에 따라 데이터 또는 데이터가 쌓인 기간을 취사선택해 분석할 수 있기 때문에, 다른 이야기를 끌어낼 수 있다. 이는 데이터 저널리스트가 경계해야 할 부분이라 할 수 있겠다.

요즘 어딜 가도 ‘문해력’, ‘리터러시’라는 말을 꼭 듣게 된다. 한국언론진흥재단에서 ‘데이터 리터러시’ 연수를 한다는 이야기를 듣고, ‘미디어 리터러시에 익숙해진 지 얼마 되지 않았는데 데이터 리터러시라니…!’라고 통탄하며 따라잡기 어려운 기술의 진보에 혀를 내둘렀다. 빅데이터. 많이 듣긴 했지만 제대로 알지는 못하는 ‘데이터’에 대한 이해를 넓혀 보자 싶어 과감하게 연수를 신청했다.

연수는 1일 차 프리 콘퍼런스, 2일 차 (본) 콘퍼런스, 3일 차 워크숍으로 진행됐다. 프리 콘퍼런스는 2일 차에 진행될 콘퍼런스에 앞서 왜 이 연수에 참가했는지, 콘퍼런스를 통해 얻고 싶은 것이 무엇인지에 대해 서로 이야기 나누는 시간이었다. 데이터 리터러시에 대한 호기심으로 오신 분들도 많았고, 서울대 빅데이터 혁신공유대학 김아미 교수에 대한 팬심으로 참석한 분도 많았다. (나 또한 둘 다였다.^^) 김아미 교수로부터 콘퍼런스 기획 의도와 각 주제별 주목할 내용에 대한 안내를 들으며 다음날 열릴 콘퍼런스에 더 큰 기대가 생겼다.

‘데이터의 힘, 사람의 힘’

이튿날 ‘데이터의 힘, 사람의 힘’이라는 주제로 진행된 저널리즘 콘퍼런스는 기존의 교사 대상 연수에서는 듣지 못한 새로운 이야기를 들을 수 있는 귀한 시간이었다. 권혜진 데이터저널리즘코리아 대표를 비롯하여 여러 연사로부터 저널리스트는 어떤 관점으로 데이터를 바라보고 있는지, 기술의 관점에서 바라보는 데이터는 어떠한지에 대해 귀중한 인사이트를 얻을 수 있었다.

먼저 기조 발제는 권혜진 데이터저널리즘코리아 대표와 김홍기 서울대 빅데이터 혁신공유대학 사업단 단장의 대담으로 진행됐다. 권혜진 대표의 강연 중 특히 ‘믿을 만한 데이터’에 대한 회의가 필요하다는 내용이 인상 깊었다. 국가 기관에서 발표한 데이터라도 부정확한 데이터가 있을 수 있으며 특히 성범죄나 아동학대처럼 통계에 잡히지 않는 사건이 많기 때문에 데이터를 비판적으로 바라보아야 한다고 권 대표는 강조했다. 원자료(raw data) 또한 비판적 리터러시의 대상이라는 의미다. 이어서 권혜진 대표는 데이터 저널리스트에게는 데이터가 취재원이라고 강조했다. 즉 같은 정보라도 관점에 따라 데이터 또는 데이터가 쌓인 기간을 취사선택해 분석할 수 있기 때문에, 다른 이야기를 끌어낼 수 있다. 이는 데이터 저널리스트가 경계해야 할 부분이라 할 수 있겠다. 데이터 저널리즘에서 가장 중요한 요소로 ‘투명성’, ‘재현성’이 있다고 한다. 일반인이 직접 데이터 분석을 재현할 수 없더라도 해당 기사가 원자료와 데이터 분석 방법을 공개하고 있는지를 체크함으로써 기사의 신뢰성을 판별할 수 있다.

김홍기 단장은 데이터의 편향성에 대해 이야기했다. 데이터는 사람이 아니지만 데이터를 모으는 주체는 사람이기에 데이터의 편향성이 생길 수밖에 없다고 한다. 일례로 미국 법무부에서 재범률 예측 프로그램을 돌렸는데 흑인의 재범률이 높은 것으로 예측됐다고 한다. 하지만 개개인이 반드시 전체 예측 결과처럼 행동할 것으로 볼 수 없다는 점, 하나의 사건과 사물에 대해 정답을 줄 수 없다는 점이 새로운 지점이었다. 인공지능을 개발하여 실생활에 적용할 때에도 이러한 편향성을 고려하여 신중하게 접근할 필요가 있음을 알 수 있었다.

 

구구절절 말보다 더 큰 힘, 데이터

 

이벤트 코너에서는 요즘 가장 뜨거운 이슈인 챗GPT를 이용한 기사 쓰기 시연이 있었다. 챗GPT가 화제가 됐을 때 나는 챗GPT의 활용성에 대한 관심보다는 걱정이 더 컸다. 그래서인지 김학래 중앙대 문헌정보학과 교수의 설명이 특히 와 닿았다. 챗GPT가 혁신적이긴 하지만 보통 새 기술이 등장하면 사람들은 그 기술에 일종의 ‘까방권’을 주기 때문에 기술이 지니는 한계와 살펴봐야 할 부분에 대해 정밀히 체크해야 한다고 김 교수는 말했다. 한편으론 마차 사업을 하던 사람에게 자동차의 등장이 위기였겠지만, 자신의 일을 ‘운송’이라고 생각하는 사람에게는 새로운 기회였다는 김 교수의 비유에 깊이 공감이 됐다. 새로운 도구를 무시하는 것이 아니라 올라타야 한다는 것. 학생들에게도 전해주고 싶은 이야기였다.

이벤트 후에 본격적인 세션이 시작됐다. 세션1은 데이터 저널리즘을 선도하는 세 명의 현직 데이터 저널리스트 강연이었다. 사실 부끄럽지만 데이터 저널리즘에 대해서는 이번 콘퍼런스를 통해 처음 알게 됐다. 그래서 세션1을 통해 데이터 저널리즘을 활용한 취재 방식, 왜 데이터 저널리즘이 필요한지에 대해 확실히 알 수 있었다. 현장에서 직접 발로 뛰는 기자의 강연을 들으니 ‘세상을 바꾸는 데이터’가 무엇인지, 느낌이 왔다.

장슬기 <MBC> 기자는 잇따른 산업 현장의 추락사를 보도하며 왜 이런 문제가 반복되는지 문제의식을 갖게 됐다고 한다. 장슬기 기자는 관련 데이터를 분석해 추락 사망 사고 및 처벌 현황을 밝혀, 제도의 문제점을 드러낼 수 있도록 기사를 기획했다고 한다. 이 이야기를 들을 때 정말 소름이 돋을 지경이었다. 데이터가 기자의 손끝에서 누군가의 삶이 이어지도록 돕는 동아줄로 변모할 수 있다는 사실을 체감할 수 있는 시간이었다.

황경상 <경향신문> 기자는 데이터 분석 결과를 독자가 이해하기 쉽도록 어떻게 시각화할지에 대한 고민과, 그 고민의 결과를 들려주었다. 이전에 인상 깊게 보았던 “매일 김용균이 있었다”[각주:1]와 같은 기사는 백 마디의 글보다 더 큰 울림을 준 지면이었다. 데이터 분석을 잘해야 할 뿐 아니라 이 결과가 독자의 머리와 가슴을 두드릴 수 있도록 하는 일이 데이터 저널리즘의 본분이라는 사실. 미디어 리터러시 교육을 할 때에도 유념해야 할 부분임을 알 수 있었다.

장슬기 <MBC> 기자의 주제 발표 시간. <사진: 필자 제공> ​

 

 

숫자에서 무엇을 읽어야 하나?

 

세션2는 데이터 시각화에 대한 이야기가 주를 이뤘다. 먼저 김승범 VWL[각주:2] 대표는 ‘숫자 더미에서 무엇을 읽어낼 것인가’를 주제로 발표했다. 김 대표는 대학원 시절 일화를 들려주었다. 언론정보학과 수업에서 중학생 한 반의 문자 메시지를 8일간 수집한 뒤 이 데이터에서 정보를 찾아내라는 과제가 주어졌다. 당시 김승범 대표는 먼저 말을 건 횟수를 기준으로 대화를 분류해 비정상적 관계(한쪽이 일방적으로 메시지를 많이 보내는 균형이 깨진 관계)를 발견할 수 있었다. 심지어 정량적 데이터만으로 학교폭력 문제까지 분석할 수 있었다. 김 대표의 강연을 들으며 우리 주변의 데이터에서는 어떤 이야기를 읽어낼 수 있을 것인지 한번 생각해보게 됐다.

<시사인>의 “화물차를 쉬게 하라”[각주:3]라는 인터랙티브 기사에서 김승범 대표는 기자를 도와 차량의 GPS 데이터를 분석하고 시각화해 화물차 기사의 하루가 어떻게 흘러가는지, 휴식 시간이 얼마나 부족한지를 밝히기도 했다. 기사에서 가장 기억에 남는 부분은 휴식 시간과 운행 시간을 원그래프로 나타낼 때 바의 길이를 다르게 하여 휴식 시간과 운행 시간의 불균형이 마치 해진 타이어처럼 보이게 했다는 점이다. 이는 화물차 운전자들의 피로도와 사고 위험을 체감할 수 있게 해주었다. 밀려드는 정보 속에서 사람들의 기억에 남는 정보가 되기 위해 데이터 시각화는 굉장히 중요한 부분임을 알 수 있는 강연이었다.

이어 신유진 전 <워싱턴포스트> 기자가 ‘비주얼 저널리즘에서 다양성은 왜 중요할까?’라는 주제로 발표했다. <워싱턴포스트>에서 비주얼 저널리스트(그래픽 기자)로 활동했던 신유진 전 기자의 발표는 모든 순간이 놀라움이었다. <워싱턴포스트>에서 데이터 시각화와 비주얼 스토리텔링을 어떻게 하는지, 딱딱한 신문 기사가 아니라 게임 형식으로도 기사가 전달될 수 있다는 사실에 충격을 받았다. 신문 기사가 맞나 싶을 정도로 화려한 프로젝트에 감탄을 금할 수 없었다. 다양한 포맷을 통해 독자의 이해를 돕고, 흥미와 참여를 높일 수 있다는 그의 설명에 고개가 절로 끄덕여졌다. 비주얼만 훌륭한 게 아니라 내부의 다양한 배경과 새로운 관점, 그리고 철저한 데이터 검증을 바탕으로 기사가 탄생하고 있다는 점도 부러웠다. 또한 데이터 편향성을 판단하기 위해 ‘이 데이터를 만든 주체가 누구인가’를 항상 고려하면서 기사를 작성한다는 신유진 전 기자의 설명을 들으며 이 또한 데이터 리터러시에서 중요하게 고려해야 할 부분임을 배웠다.

 

 

 

신유진 전 <워싱턴 포스트> 그래픽 기자의 주제 발표 시간. <사진: 필자 제공>

 

교육 현장과 데이터 리터러시

 

마지막 날 연수생과 김아미 교수와 함께한 워크숍이 열렸다. 네 가지 질문이 화면에서 우리를 기다리고 있었다.

Q. 나에게 ‘데이터’는 어떤 의미인가?
Q. 데이터와 사람의 관계는?
Q. 챗GPT 등 인공지능 기술 발전을 보는 나의 생각은?
Q. 지금 사회를 살아가는 우리는 ‘데이터’에 대해 어떤 태도와 능력을 갖추어야 할까?

전날 들었던 콘퍼런스의 인상 깊었던 내용에 대해 이야기 나누면서, 교육 현장에서 데이터 리터러시를 가르치기 위해서는 어떤 수준에서 어떤 내용을 가르쳐야 할 것인지 고민했다. 아무래도 학교 현장에서는 데이터에 대한 접근성이나 다루는 능력이 떨어지기 때문이다. 하지만 여전히 우리 주변에는 많은 데이터(학생 성적, 지각, 교사에 대한 평가 등)가 있고 이러한 데이터를 어떻게 바라볼 것인지, 이를 어떻게 시각화해 제공해야 학생들에게 도움이 될지 등 연구해볼 만한 여지가 많았다. 또한 데이터를 표현하는 능력도 글쓰기 영역에 포함될 것이며, 데이터 리터러시를 기르기 위해서는 데이터 분석의 기준이 있어야 한다는 이야기에 공감대가 형성됐다.

부족한 시간이지만 다른 참가 선생님들과 함께 데이터 리터러시 수업 활동을 구상해 보았다. 우리 모둠에는 특성화고에서 빅데이터 분석을 가르치시는 선생님, 초등학교 선생님, 고등학교 국어 교사인 내가 모였다. 다른 과목의 선생님들과 모여 이야기를 나누며 데이터 리터러시에 대한 다양한 고민을 공유할 수 있었고, 데이터 리터러시 교육에 대해 새로운 접근을 할 수 있었다.

“데이터 리터러시에 대해 모두 알게 됐다!”라고 할 수는 없지만, 데이터 저널리즘이 무엇인지, 데이터 리터러시를 기르기 위해 어떤 것이 필요한지, 학교에서 데이터 리터러시를 가르치려면 무엇이 필요한지 고민해보고 나눌 수 있는 소중한 시간이었다. 콘퍼런스와 워크숍을 훌륭하게 준비하고 진행한 김아미 교수와 연수를 기획한 한국언론진흥재단에 깊은 감사를 전하고 싶다.

 

 

 

 

 

본 원고는 한국언론진흥재단의 정부광고 수수료를 지원받아 작성되었습니다.

↓↓ 자세한 내용은 링크를 통해 확인해주세요. ↓↓