전문가 뛰어넘는 'AI 문헌학자'…라틴어 비문 연대 추정 도구 개발

  • 구글 딥마인드 연구팀, '이니어스' 사용 논문 '네이처'에 발표

미국 메트로폴리탄 미술관에 소장돼 있는 라틴어 동판 조각 기원후 113-114년에 한 로마 수병이 받은 트라야누스 황제 명의의 동판 제대증서로 소실된 부분의 문구오른쪽는 인공지능AI으로 복원된 것이다 사진연합뉴스
미국 메트로폴리탄 미술관에 소장돼 있는 라틴어 동판 조각. 기원후 113-114년에 한 로마 수병이 받은 트라야누스 황제 명의의 동판 제대증서로, 소실된 부분의 문구(오른쪽)는 인공지능(AI)으로 복원된 것이다. [사진=연합뉴스]
라틴어 비문의 연대와 장소를 추정하고 멸실된 텍스트를 복원하는 전문가들에게 도움을 주는 인공지능(AI) 도구가 개발됐다고 구글 딥마인드가 23일(현지시간) 발표했다.

딥마인드에 따르면 이 회사와 구글 본사 소속 연구자들과 영국 노팅엄대, 워릭대, 옥스퍼드대 등의 고전학·고고학 연구자들은 생성형 신경망 AI 도구 '이니어스'(Aeneas)를 소개하는 연구 논문을 이날 과학저널 '네이처'에 게재했다.

연구자들은 알려진 라틴어 비문들의 데이터세트를 이용해 이니어스를 훈련시켰다.

비문 작성 연대 추정에는 철자법, 문법, 표현, 인용된 사건이나 지명·관직명 등 다양한 기준이 이용되며, 문헌에 대한 폭넓은 지식이 필요하다.

논문 저자들은 인간 역사학자가 텍스트 연대·장소 추정과 복원 작업에서 이니어스의 도움을 받은 경우, 인간이나 이니어스가 각각 단독으로 작업할 때보다 우수한 결과를 낼 수 있었다고 보고했다.

이 연구에 피험자로 참여한 역사학자 23명은 이니어스가 찾아서 제시해준 기존 데이터세트 내 유사 사례들 중 90%가 작업의 출발점으로서 유용했다고 평가했다.

23명의 경력은 석사과정 대학원생으로부터 교수까지 다양했다.

텍스트 복원 능력 시험은 알려져 있는 기존 텍스트에서 일부를 일부러 삭제해서 '문제'를 만들어 풀어보도록 하는 방식으로 이뤄졌다.

추정 작업에서 이니어스는 연구에 참여한 인간 학자 평균보다 능력이 오히려 우월했다.

글자 10자를 삭제한 후 복원해 보라는 과제를 수행한 결과, 오류율은 인간 학자가 혼자 했을 때 39.0%, 이니어스의 유사 사례 제시 도움을 받은 인간 학자가 33.9%였다. 반면 이니어스가 단독으로 내놓은 추정 결과의 오류율은 23.1%에 불과해 매우 우수했다.

다만 인간 학자가 이니어스의 유사 사례 제시와 추정 양쪽 모두를 참고해서 복원작업을 한 결과의 오류율은 21.4%로 그보다도 더 우수했다.

실제 작성 연대의 '정답'이 알려져 있는 비문의 연대 추정을 이니어스에게 맡겨 테스트해본 결과, 실제 연대와 추정 연대의 차이는 평균 ±13년 수준이었다.

논문 저자들은 고대 로마의 매우 유명한 텍스트 '신격 아우구스투스 업적록'(Res Gestae Divi Augusti)을 가지고 이니어스의 연대·장소 추정 능력을 시험해봤다.

논문의 '방법' 부분에 실린 배경 설명에 따르면 이 텍스트는 고대 로마제국 초대 황제 아우구스투스(기원전 63년∼기원후 14년)가 쓴 것으로, 1인칭으로 자신의 업적을 회고한 글이다.

이 글은 아우구스투스가 세상을 떠난 직후 로마 원로원에서 낭독돼 처음 발표됐으며, 글 안에는 "내가 이것을 썼을 때는 나의 76번째 해였다"는 말이 나온다.

따라서 아우구스투스가 이 글을 마무리한 시기는 아우구스투스의 만 75세 생일인 기원후 13년 9월 23일부터 아우구스투스가 세상을 떠난 기원후 14년 8월 19일 사이인 것이 확실하며, 현재 유력한 학설로는 기원후 14년 여름이라는 것이다.

다만 아우구스투스가 이 글을 단번에 쓴 것이 아니라 기원전 23년께부터 회고록 작성을 시작해서 오랜 세월에 걸쳐 계속 내용을 다듬고 추가해왔을 가능성을 배제할 수 없다는 지적도 학계에서 나온다.

이번 논문 저자들이 이니어스에게 이 글을 장별로 나눠서 작성 연대를 추정토록 해 본 결과, 이니어스는 작성 시기는 기원후 10∼20년 혹은 기원전 10년∼기원전 1년일 확률이 가장 크고 작성 장소는 로마일 공산이 가장 크다고 답했다.

이니어스는 시기 추정의 근거로 철자법이나 표현, 그리고 글 안에 거론된 사건, 장소, 관직명 등을 꼽았다.

논문 연구자들은 이니어스가 내놓은 추정 결과에 대해 "세계 수준의 전문가가 내놓은 통찰과 잘 들어맞는다"며 "이니어스는 통시적(diachronic), 언어적 패턴을 체계적으로 분석함으로써 전통적인 역사 연대 추정과 유사 사례 검색 방법을 지원할 뿐만 아니라 보완하며, 이를 통해 심층적 역사학적 분석을 위한 혁신적 도구를 제공한다"고 자평했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기