데이터어떻게 보여줄 것인가? 2013 데이터 저널리즘 어워드 후보작 - 2



글로벌 에디터 네트워크(Global Editors Network, GEN)가 주최하고 구글이 후원하는 '데이터 저널리즘 어워드(Data Journalism Awards, DJA)'가 올해로 2회를 맞이 했다. 총 72개 후보작 중 8개의 프로젝트가 수상의 영예를 안게 된다. 총 4개 부문에서 각각 소규모 미디어 그룹과 대형 미디어를 하나씩 선정하는 방식이다. (여기서 미디어 그룹의 규모를 나누는 기준은 정규직 기자 수로, 30명 이상이면 Big Media로 분류된다.) 




  1. 데이터를 통한 (모바일 또는 웹) 어플리케이션 (Data-driven applications (mobile or web))

  2. 데이터 저널리즘 웹사이트 혹은 섹션 (Data journalism website or section)

  3. 데이터를 통한 탐사보도 (Data-driven investigative journalism)

  4. 데이터 스토리텔링 (Data storytelling)


▲ '데이터 저널리즘 어워드' 수상 부문



피크15 커뮤니케이션 부설 소셜 캠페인 연구소에서는 1, 2번 영역에 해당되는 프로젝트를 소개한 바 있다. (바로가기: '2013 데이터 저널리즘 어워드' 후보작 1) 이를 바탕으로 3, 4번 카테고리에 속하는 사례를 둘러보자. 




1. 코스타리카 고등교육 수혜의 지역편차

   (Patterns of exclusion from higher education in Costa Rica)


코스타리카 언론 라 나시온(La Nacion)의 프로젝트는 현재 미국의 마더 존스(Mother Jones)의 '아메리카 언더 더 건'(America Under The Gun) 프로젝트에 이어 '데이터를 통한 탐사보도 - 빅미디어' 부문 온라인 투표 2위를 달리고 있다.  


보도의 핵심은 구글 맵에 표현된 코스타리카 고등교육 수혜자의 지역적 편차이다. 우리식으로 표현하면, 전국의 모든 고등학교를 조사해 각 지역별 서울대 합격생 편차를 지도 위에 표현한 것이다. 



▲ '라 나시온'의 코스타리카 고등교육 수혜 지역편차



우리나라도 최근 수도권 학생들의 상위 대학 진학률이 갈수록 높아지고, 교육을 통한 사회적 지위의 세습이 이루어지고 있다는 기사가 자주 보도되고 있다. 


코스타리카의 상황도 크게 다르지 않았던 것 같다. 그러나 이를 실제적으로 증명할 데이터는 없던 상황에서 라 나시온(La Nacion)에서 이를 보도한 것이다. 


먼저, 코스타리카 최고의 공립 대학 코스타리카 대학교(Universidad de Costa Rica)에서 2006년에서 2011년까지의 입학지원서를 (학생들의 이름은 지우고) 입수해 20가지 변수로 분류했다. 그리고 국토를 81개 지역으로 나누고 각각의 경제 수준은 유엔빈곤지수 (Cantonal Human Poverty Index - developed by the United Nations Program in Costa Rica)를 활용해 판별했다. 


그 결과 위와 같이 수도권, 해안가 지역 중산층 이상에서 UCR 합격 비율이 월등하다는 결과를 얻어냈다. 




2. 초짜를 위한 미술 정보 (The Art market for Dummies)


프랑스의 웹사이트 '쿠와'(불어: http://quoi.askmedia.fr/ , 영어: http://jeanabbiateci.fr/art-v8)는 '일자무식'을 위한 공간이다. 사람들이 피카소, 워홀 등의 아티스트와 그들의 작품은 알아도, 미술 시장이 어떻게 돌아가는지에 대해서는 잘 모른다. 


프랑스의 장 아비아테시(Jean Abbiateci, Ask media 소속)는 이 점에 착안해 미술 시장 자체를 쉽게 설명해주는데 집중한 웹사이트를 만들었다. 



▲ 최근 5년간 미술품목별 거래량



작업은 간단하지 않았지만, 이미 우리에게 개방되어 있는 도구만을 활용했다.  Artprice.com에 올라온 pdf 정보를 파이어폭스 add-on 중 하나인 Outwit를 활용해 excel로 변환했다. 이후 Google API Currency Converter를 활용해 환율을 계산하고, 다른 오픈소스 코드를 활용했다. 


이를 통해서 장 아비아테시는 미술 시장 거래 대부분이 남성작가의 작품이고, 최근 5년 사이 중국 미술시장의 급성장을 그래프로 뽑아낼 수 있었다. 



▲ 최근 10년간 국가별 미술시장 성장률



현재 이 웹사이트는 데이터 스토리텔링 스몰 미디어 부문 온라인 투표에서 독보적인 1위를 달리고 있다. 





3. 헝가리 언론의 저항 (The Media Industry under the Orban-regime)


헝가리에서는 2010년 뉴라이트 계열의 정부가 들어선 이후 언론 통제가 국가 최대 이슈 중 하나가 되었다. 미디어 회사를 소유하고 있는 총리로 인해 광고로 지출되는 공공자금이 특정 미디어로 흘러들어가고 있다는 의혹도 이때 제기 되었다. 


이를 증명하기 위해 크레아티브 마가진(Kreativ Magazin)의 프로젝트가 시작되었다. 문제의 칸타르(Kantar) 미디어의 헝가리 시장 내 점유율, 매출 정보, TNS와 같은 조사기관 등의 광고수신정보 등을 유무료로 구해 조합했다. 


그 결과를 엑셀, 인포그램, 구글맵을 활용해 한 눈에 볼 수 있는 그림으로 만들어 보도했다. 



▲ 크레아티브 마가진의 인포그래픽



헝가리 내부에서 어떤 영향이 있었는지는 확인하기 어려웠으나, 이번 디지털 저널리즘 어워드 '데이터를 통한 탐사보도 - 스몰 미디어' 부분 유력한 수상자로 거론되는 것으로 보아 그 파장이 작지 않았음을 추측할 수 있다. 




글 • 정재훈 <Peak15 communications 캠페인 AE>




저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License
YOUR COMMENT IS THE CRITICAL SUCCESS FACTOR FOR THE QUALITY OF BLOG POST





지난 5월 31일, 글로벌 에디터 네트워크(Global Editors Network)와 구글이 함께 선정한 제 1회 데이터 저널리즘 어워드(2012 Data Journalism Awards)에서 가디언의 오픈저널리즘 기사 <Reading the Riots(영국 폭동에 대한 진실 찾기)>가 "데이터 시각화/스토리텔링" 부문에서 1위를 차지했다.

 

2011년 8월 영국에서 일어난 폭동 사건에 대해 심층적으로 조사한 <Reading the Riots> 섹션 중 트위터 257만건을 분석한 '폭동 관련 루머 트위터 확산 양상(How riot rumours spread on Twitter)'의 인터랙티브 데이터 시각화가 수상한 것이다. 


데이비드 캐머런 영국 총리는 폭동 사태가 범죄조직에 의한 것이라고 주장했지만, 가디언은 독자들의 이야기를 직접 들었다. 영국 폭동 사태의 원인에 대해 의견이 분분하자, 가디언은 '주장'보다는 '증거'가 중요한 데이터 저널리즘이 필요한 때라고 판단한다. 어디서 어떤 사건이 일어났는지에 대한 공인된 사건 리스트를 가디언 온라인 페이지에 올리고, 독자들로 하여금 데이터 시트를 다운받아 함께 작성할 수 있도록 한다. 구글 퓨전 테이블을 사용해 이 사건들을 지도에 표시하고, 독자들과 함께 지도를 완성해 나간다. 


▲ 영국 폭동 사태에 대해 독자와 함께 만든 인터랙티브 맵. 빨간 원은 최근 사건, 흰색 원은 이전 사건을 나타낸다


이어서 런던 정경대(LSE)와 함께, 폭동에 참여했던 270명을 인터뷰하고, 영국 폭동 사태와 관련된 해시태그가 포함된 257만 건의 트윗을 분석했다. 영국 폭동 관련 각종 루머들이 트위터로 확산되며 폭동을 부추겼다는 다른 언론의 보도와 달리, 가디언은 트위터상의 루머들이 규제받지 않는 자유로운 토론 끝에 어떻게 자정작용을 거치는지에 대한 양상을 살펴봤다.


▲ 트위터 주요 루머 일곱 가지



가디언 데이터팀은 영국 폭동 사태를 취재한 기자들과 함께 일곱 가지 주요 루머를 나눴다. 군대의 탱크가 런던 시내에 배치되었다는 것에서부터 경찰이 16세 소녀를 폭행했다는 것까지 루머의 내용은 다양했다.


가디언의 트윗 분석은 루머가 트윗에서 사용자들간의 자유로운 토론과 멘션, 리트윗을 통해 어떻게 스스로 자정작용을 거치는 것에 대한 것이기 때문에, 각 루머별로 타임라인에 따라 의견이 어떻게 확산되고 반박되는지를 시각화했다.

각 루머의 시작, 발원 트윗 포스팅을 찾고, 이것이 영향력 있는 트위터러에 의해 확산되는 시점, 루머의 내용이 반박되고 의문이 제기되는 주요 포인트 시점을 파란 선으로 표시했다.



▲ 트위터 루머 확산 인터랙티브 타임라인



초록색 원은 지지하는 내용, 빨간색 원은 반박, 노란색 계열은 의문을 제기하는 내용이다. 색이 짙은 정도에 따라 내용의 수위가 강력하다. 원의 크기는 영향력의 크기다. 원에 마우스를 가져다 대면, 각 원별로 어떤 트윗 내용인지, 트위터러의 팔로워 숫자는 몇인지가 나온다. 각 원마다 모든 트윗 포스팅이 정확히 표기되어 있어 루머의 확산 양상과 반박 내용을 알 수 있다.


예를 들면, 폭도들이 런던 동물원을 습격해 호랑이 등 동물들이 풀려났다는 루머와 함께 사진까지 등장하자 초록색 원이 커진다. 그러다 이를 반박하는 빨간색 원이 등장한다. 이는 2008년 이탈리아의 호랑이 사진이며 런던 동물원은 안전하다는 트윗의 내용이 확산된다.


타임라인별로 마우스를 드랙해서 보면 원의 크기가 커졌다가 줄어들고, 반박과 지지가 엎치락 뒤치락하는 등 시간별 트윗 양상이 명확하게 시각화된다. 데이터 저널리즘 어워드의 심사위원 저스틴 애런스타인(Justin Arenstein)은 이 트윗 분석 데이터 시각화 작업이 전통적인 텍스트 기사에서는 보여주기 어려운 시간의 흐름에 따른 경향성을 보여준다고 평가했다. 또한 원으로 된 그래픽을 마치 세포체의 성장처럼 시각화한 것이 루머가 스스로 복제되는 성향을 더욱 잘 보여준다고 말했다.


가디언은 영국 폭동 사태에 대해 인터랙티브 맵, 인터랙티브 타임라인 등 30여 개의 데이터 시각화 인포그래픽을 제작했다. 독자들에 대한 온라인 설문과 폭동 참가자에 대한 심층 인터뷰를 통한 폭동 참여자 분석 맵, 폭동 사건의 유형 인포그래픽, 폭동 시간별 타임라인, 트위터 타임라인, 트위터 영향력 탑 200 명 리스트 등 전방위적인 해석을 통해 영국 폭동 사태를 다각적으로 분석한다. 


▲ 트윗 영향력 탑 200명의 영국 폭동 관련 리트윗 수 ▲ 영국 폭동 관련 해쉬태그와 영향력 


▲ 트위터 지역별 타임라인 


 

▲ 폭동 가담자와 빈곤의 상관관계 인터랙티브 맵. 푸른색에서 붉은색으로 갈수록 빈곤 지역


 

▲ 영국 폭동 타임라인 인터랙티브 맵



▲ 폭동 가담자들의 체포 죄목 분류 인터랙티브 데이터


▲ 폭동 가담자들이 습격한 점포 유형




▲ 영국 폭동 가담자들에 대한 리서치



가디언은 이 모든 인포그래픽과 맵의 자료를 공개했다. 가디언은 데이터 스토어를 운영 중이며, 오픈API정책을 통해 가디언의 데이터, 통계 등을 무료로 공개하고, 누구나 이를 활용한 어플리케이션을 개발할 수 있도록 하고 있다. 영국 폭동 사건에 대한 모든 데이터를 독자와 함께 완성하고, 수집한 모든 데이터를 공개하는 것을 통해 데이터 저널리즘의 결정판을 보여준다. 


가디언의 다각화된 분석 결과, '경찰에 대한 불신과 반감'이 폭동에 가담한 가장 중요한 원인인 것으로 밝혀졌다. 이는 영국 정부가 폭동은 도덕의 붕괴와 범죄 집단이 핵심적 역할을 했다고 발표한 것과 큰 차이가 있다. 많은 가담자들이 면담과정에서 이번 폭동이 명백한 반경찰 정서가 있었기 때문에 참여해야 할 것 같은 느낌을 받았다고 말했다. 또 경찰의 ‘치안유지 활동’이라는 단어가 가장 강력한 동기가 됐다고 밝혔다. 


아울러 폭동에 가담한 사람들 대부분은 '사회 불평등'에 대해 말했다. 많은 학생들이 면담과정에서 3배나 인상된 수업료와 적은 고용기회를 언급했다. 또 폭동은 다양한 계층과 인종으로 구성돼 있었으며 트위터와 페이스북보다는 블랙베리의 무료 문자메시지 서비스인 BBM이 주된 소통 도구로 이용됐던 것으로 드러났다. 즉, '폭동 참여자들은 범죄에 심취한 일부 사람들'이라는 당시 주류 언론의 전제가 옳지 않음이 증명된 것이다.


가디언의 데이터가 모든 것을 말하게 하되, 그 데이터를 독자들의 참여로 함께 만들어가는 오픈 저널리즘의 멋진 사례로 기록할 만하다.


글˙송혜원<피크15 커뮤니케이션 부설 연구소 소셜캠페인 연구원>




저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License
YOUR COMMENT IS THE CRITICAL SUCCESS FACTOR FOR THE QUALITY OF BLOG POST


티스토리 툴바