뉴스 빅데이터로 본 인공지능(AI)의 역사
[요약] 지난 3월 이세돌과 알파고의 바둑 대결이 ‘인공지능’에 대한 생각을 어떻게 바꿔놨을까요? 그리고 알파고 이전, 우리는 인공지능을 어떻게 생각해왔을까요? 빅카인즈를 이용해 30개 매체의 인공지능 관련 기사를 분석한 결과를 알려드립니다.
지난 3월 이세돌 9단이 알파고와의 바둑 대결에서 4대1로 패한 충격이 아직 가시지 않고 있다. 신문에선 인공지능(artificial intelligence, AI)이 사람의 일자리를 위협한다거나, 제4차 산업혁명이 일어날 것이란 예견이 자주 등장하고 있다. 1956년 미국 다트머스 대학교의 컴퓨터 과학자 존 매커시가 기획한 다트머스 회의(Dartmouth Conference)에서 처음 제안된 AI란 용어는 올해 가장 큰 화두 중 하나라 해도 과언이 아니다. 그렇다면 알파고의 충격은 인공지능에 대한 생각을 어떻게 바꿔놨을까? 알파고 이전에 우리는 인공지능을 어떻게 생각해왔을까?
#'이세돌 vs 알파고'에서 '인간 vs 인공지능'으로
알파고와 이세돌 9단의 대결 덕분에 올해는 4월까지의 기사만 집계했음에도 인공지능과 관련한 기사가 다른 어느 해보다도 많았다. 올해 관련 기사의 인용문 주제를 분석해 보면 [그림 1]과 같다. ‘이세돌’을 중심으로 하는 주제 군집과 ‘인공지능’을 중심으로 하는 주제 군집이 ‘알파고’를 통해 매개되고 있음을 알 수 있다.
단어 간 선의 굵기로 나타난 공동 인용 빈도를 보면 ‘알파고’는 ‘인공지능’보다는 ‘이세돌’과 더 자주 함께 거론되고 있다. 이는 ‘인공지능’이 포함된 기사의 인용문에서 ‘알파고’가 가장 활발한 화두였지만, 인용문에선 ‘알파고’는 주로 ‘이세돌’과의 대국 차원에서 거론됐고, 이와 별개로 ‘인공지능’ 자체에 대한 논의가 이뤄졌음을 시사한다. 즉 ‘알파고’는 ‘이세돌’과 대국을 통해 언론이 ‘인공지능’에 주목하는 계기를 마련했으며, ‘인공지능’ 전문가들은 ‘알파고’와 상관없이 인공지능 자체에 대한 성찰을 얘기했음을 시사한다.
[그림 1] 알파고, 인공지능, 이세돌 관련 주제 중심어 연결망 (2016.1.1.-2016.4.30.)
또한, 인용문 주제를 분석해 보면 ‘알파고’와 ‘이세돌’ 간 대국과 관련된 내용이 다양하게 언급되는 동시에, ‘인공지능’ 관련 주제의 경우 일자리 위협에 대한 내용이 많은 것으로 나타나고 있다. 이러한 기사들은 ‘알파고’ 대 ‘이세돌’의 대결을 ‘인공지능’ 대 ‘인간’의 대립 구도로 일반화하는 것처럼 보인다.
#인공지능 20년: 한국의 검색엔진에서 구글의 딥러닝으로
알파고 이전 20년 간 ‘인공지능’을 중심으로 함께 인용문에 출현한 주제를 추출해 뉴스 인용문 주제 중심어 연결망으로 시각화해보았다.
[그림2] 인공지능 관련 주제 중심어 연결망 (2006.1.1.-2015.12.31.)
1996년부터 2005년까지인 1기엔 ‘검색엔진’, ‘인터넷 네트워크’, ‘데이터베이스’, ‘언어처리’ 등이, 2006년부터 2015년까지인 2기엔 ‘빅데이터’, ‘딥러닝’, ‘구글’ 1 등의 주제가 인공지능과 같은 인용문에 출현했다.
또 1기엔 국내 기업이나 연구진을 중심으로 검색엔진을 위주로 인공지능의 활용가능성을 검토하면서 그것이 인터넷 환경을 어떻게 개선할지에 대한 내용을 위주로 인용이 됐다. 반면 2기엔 미국 기업을 중심으로 인공지능 개선을 위한 빅데이터 활용, 인공지능 개발을 선도하는 구글, 인공지능의 상용화 방안, 딥러닝 등의 내용이 자주 인용되고 있었다. 2기에 출현한 주제들은 주로 해외에서 활발하게 이루어지고 있는 내용들을 담고 있는 경우가 많았다. 인공지능과 관련해 국내 기술 위주 보도에서 해외 기술 위주 보도로의 변화가 일어났다는 추론이 가능하다.
한편, 최근 글로벌IT 기업들이 경쟁적으로 내놓고 있는 ‘챗봇’과 같은 인공지능 대화 서비스와 관련한 내용이 1기에도 나타나 눈길을 끌었다. 즉 1기엔 인공지능을 언급한 인용문에 ‘메신저’라는 주제가 국내 기업의 챗봇과 관련돼 2002년에서 2004년 사이에 자주 인용됐다. 2기에는 인공지능 HTS, 인공지능 종목 추천, 인공지능 투자 등 주식 관련 주제어도 눈에 띄었다.
#인공지능의 오래된 화두: 자동차와 경쟁력
‘자동차’는 인공지능과 관련해 지난 20년 간 뉴스 속에서 지속적으로 활발히 논의된 주제였다. ‘자동차’의 경우 1기엔 제동장치, 변속 장치, 에너지 효율 등 주로 자동차 안전을 확보하기 위한 방법으로 언급됐다. 구체적으로는 현대 모비스 등 자동차 부품 생산업체가 정보원으로 등장하면서 사고 발생시 자동으로 펼쳐지는 에어백 등 자동차 안전 관련 내용이 주로 언급됐다.
2기엔 연료 분사, 속도 제한, 브레이크 작동, 내비게이션, 위험 감지 등 1기에 언급되던 자동차의 주요 기능들이 모두 소프트웨어로 작동되는 현상을 설명하면서 인공지능이 언급되는 경우가 많았다. 또 무인자동차 소개와 자동차 배출 가스 제어 등 친환경 분야 기술 적용에 관한 설명을 위해 인공지능을 언급한 경우가 많았다. 이와 함께 2기엔 자동차 부품 제조사가 아닌 자동차 생산 회사가 주된 정보원으로 등장했다.
한편, 인공지능 관련한 기사들의 인용문 내용을 보면 자동차를 주제로 하면서 국가나 기업의 ‘경쟁력’을 언급하는 것도 특징이었다.
※ 뉴스 빅데이터 분석 및 방법
- 검색어: 인공지능
- 분석매체: 경향신문, 국민일보, 내일신문, 동아일보, 문화일보, 서울신문, 세계일보, 한겨레, 한국일보(이상 중앙지 9개), 매일경제, 서울경제, 파이낸셜뉴스, 한국경제, 헤럴드경제(이상 경제지 5개), 경남도민일보, 경남신문, 경상일보, 광주일보, 국제신문, 대전일보, 매일신문, 무등일보, 부산일보, 영남일보, 전남일보, 전북일보, 중도일보, 중부매일, 충북일보, 한라일보(이상 지방지 16개)
- 분석지면: 전 지면
- 분석기간: 20년4개월(1996년1월1일-2016년4월30일)
- 분석 항목: 정보원(중복 제거), 인용문 주제(중복 제거)
- 분석 의미연결망: 정보원-인용문 주제연결망(2원 연결망)
- 분석 및 시각화 프로그램: Excel, Ucinet, Netdraw, Netminer, 자체개발 프로그램
- 자료수집: <빅 카인즈> http://tools.kinds.or.kr/adam/login.do
- <빅카인즈> 자연어처리 성능: 인명 85.51%, 조직명 88.96%, 직업/직위 82.62%, 지역명 93.82% (이상 F1 score 기준), 인용문 추출 82.26%(정확도 기준)
[활용 자료]
한국언론진흥재단, NAI 1권 2호, 2016. 06.
- 딥러닝 : 딥러닝은 사물이나 데이터를 군집화하거나 분류하는데 사용하는 기술로 기계학습(Machine Learning) 알고리즘 중 하나입니다. 딥 러닝의 핵심은 분류를 통한 예측입니다. 수많은 데이터 속에서 패턴을 발견해 인간이 사물을 구분하듯 컴퓨터가 학습을 통해 데이터를 자동으로 구분할 수 있도록 하는 것입니다. [본문으로]