전주신흥고등학교 로고이미지

RSS 페이스북 공유하기 트위터 공유하기 카카오톡 공유하기 카카오스토리 공유하기 네이버밴드 공유하기 프린트하기
로봇 기자 시대가 온다
작성자 김성식 등록일 17.07.13 조회수 265
첨부파일

로봇 기자 시대가 온다


알고리즘 시대가 오고 있다. 사람이 할 수 있는 일을 대신할 수 있는 알고리즘이 속속 개발되는 중이다. 컴퓨터가 알고리즘에 따라 기자 대신 기사를 쓰고, 자동차는 알고리즘을 이용해 운전수 없이도 도로를 달린다. 알고리즘은 정녕 인간을 대체하고 말까? 그러면 그때 인간은 무엇을 해야 할까?


로봇기자_img2

[그림1] 출처 (GIB)

로봇 기자의 탄생

많은 사람들이 이제 종이 신문보다는 인터넷 같은 온라인을 통해 각종 정보를 얻는다. 온라인에서는 종이 신문과 달리 거의 실시간으로 새로운 정보를 접할 수 있다. 기자들은 계속해서 이슈와 사건에 기민하게 움직여 뉴스를 생산해야 한다. 하지만 그러다 보면 중요한 이슈를 전부 다루지 못하거나, 기자의 전문성에 비해 기사의 깊이가 부족해지기도 한다. 그래서 등장한 것이 바로 로봇 기자다.


로봇 기자는 자동으로 기사를 쓰는 컴퓨터 프로그램을 말한다. 우선, 컴퓨터의 성능이 아무리 뛰어나도 아무런 학습도 없이 컴퓨터가 어떤 일에 대해 스스로 판단을 내릴 수는 없다. 따라서 아주 간단한 일이라도 컴퓨터에게 문제를 해결하는 정확한 절차와 방법을 가르쳐 줘야만 하는데, 이를 ‘알고리즘’이라고 한다. 컴퓨터는 알고리즘 덕분에 다양한 일들을 단계적으로 처리할 수 있다.


로봇 기자가 처음 등장한 것은 2009년 4월이다. 미국 노스웨스턴대 저널리즘학과와 컴퓨터공학과 학생 4명은 수업에서 조별 과제를 하기 위해 뭉쳤다. 이때 과제의 주제는 기자들의 단순 노동을 줄여 좀 더 가치 있는 일에 집중할 수 있도록 만드는 것이었다. 여기서 탄생한 것이 바로 기사를 쓰는 알고리즘, ‘스태츠 몽키’다.


빅 데이터 취재는 로봇 기자에게

로봇기자_img3

[그림2] 출처 (GIB)

이 알고리즘은 메이저리그와 미국 대학농구, 미식축구리그 등 스포츠 뉴스를 자동으로 생산하도록 짜여 있다. 덕분에 기자들은 스태츠 몽키를 활용해 매일 진행되는 스포츠 경기 결과를 요약하는 기사는 컴퓨터에게 맡기고, 대신 분석 기사나 인터뷰 등 깊이 있는 기사에 집중할 수 있게 됐다.

정보가 넘쳐나는 빅 데이터 시대에는 이를 분석해 의미 있는 정보를 찾아내는 일이 매우 중요하다. 스태츠 몽키는 그날 경기한 스포츠 정보를 실시간으로 모은다. 이렇게 모인 데이터들은 ‘의사결정나무’란 학습 알고리즘을 통해 다시 분류한다.

의사결정나무 알고리즘은 의사결정 규칙을 나무 구조로 도표화해서, 데이터를 몇 개의 소집단으로 분류하는 방식으로 결과를 예측하는 분석법이다. 스무고개 게임처럼 여러 질문에 대한 답을 따라가다 보면, 데이터가 몇 개의 소집단으로 분류되는 것이다. 그리고 질문이 끝날 때 나무 가지의 가장 아래쪽에 도착하면 최종 결과를 얻는다.

스태츠 몽키는 이 의사결정나무 알고리즘을 통해 그 날의 야구 경기에 대한 정보 중에서도 주요 선수와 경기 진행과 관련된 데이터를 분류해 이를 분석한다. 그리고 그 결과를 이미 짜놓은 기본 문장 구조에 입력하면, 단 몇 초 만에도 짧은 야구 경기 기사 하나를 완성할 수 있다.


미국에서는 이미 이렇게 알고리즘을 활용한 기사들이 연간 수만 건씩 쏟아져 나오고 있다. 스태츠 몽키 알고리즘을 활용해 기사를 생산하는 ‘스태츠 시트’사 외에도, 스포츠 기사와 금융 기사를 쓰는 ‘내러티브 사이언스’ 같은 회사도 알고리즘 기사를 주요 언론사에 판매하고 있다.

우리나라의 경우, 2013년부터 한국어 특성에 맞는 기사 요약 알고리즘이 등장하기 시작했다. 그 중 UNIST(울산과학기술대)의 창업동아리 ‘뉴스잼’이 개발한 기사 요약 알고리즘은 다음과 같은 단계로 작동한다.

우선 온라인에서 한국어 뉴스 기사를 찾아낸 뒤(⓵데이터 추출부), 기사 전문을 문장별로 분리한다(⓶전처리부). 다시 문장을 품사로 구분하고, 구분된 품사들 중 미리 지정된 품사가 포함된 비율을 고려해 각 문장의 특징을 파악한다(⓷특징추출부). 그리고 문장의 특징을 바탕으로 문장별 점수를 환산한 뒤(⓸환산부), 점수에 따라 문장별 우선순위를 정한다(⓹순위정렬부). 마지막으로, 우선순위에 따라 문장을 배열해 요약 기사를 만드는 것이다(⓺요약데이터 생성부).


이렇게 정보 위주로 단순 명료하게 구성된 알고리즘 기사는, 풍부한 정보와 깊이를 담고 있는 인간이 쓴 기사와는 분명 차이가 있다. 하지만 알고리즘 기자를 감히 상상도 못했던 예전을 생각하면, 정말 놀라운 일이다. 그렇다면 언젠가 알고리즘 기자가 인간 기자를 온전히 대체하게 될 날도 찾아오지 않을까?


<뉴스잼의 기사 요약 알고리즘>

데이터추출부

전처리부

특징추출부

환산부

순위정렬부

요약 데이터 생성부

로봇기자_img1

[그림3]

인간은 더욱 가치 있는 일에 힘써야

사실을 단순 명료하게 정리한 알고리즘 기사는 풍부한 정보와 깊이를 담을 수 있는 인간의 기사와는 분명 차이가 있다. 도로 교통 상황에서는 분명 알고리즘을 따라 움직이는 무인자동차가 해결해 줄 수 없는 문제도 있을 것이다. 하지만 알고리즘이 충분히 발달하면 기본적인 수준에서는 얼마든지 인간을 대체할 수 있다.

인간이 쓸모없어진다고 너무 걱정하지는 말자. 이런 알고리즘을 만드는 건 인간이 남는 시간을 더욱 가치 있는 일에 쓸 수 있도록 하기 위해서다. 알고리즘의 도움을 받으면 인간의 문명은 더욱 발전할 수 있다.

필자 소개 / 김정

《과학소년》, 《수학동아》를 거쳐, 현재 《어린이과학동아》 기자로 활동하고 있는 10년 차 과학기자다. 대한민국의 수포자가 모두 없어지는 그날을 꿈꾸며 생활 속 즐거운 수학을 맹렬히 탐색하고 있으며, 신기한 과학을 널리 전하기 위해 노력하고 있다.?

글_ 김정

출처_ 사이언스올​

이전글 대학생이 제안하는 나의 초·중등 방학생활
다음글 학생의 진로탐색 지원을 위한 진로체험 활성화 정책