[맛있는 테크스낵] AI 성능, 7개월마다 역량 2배 증가…성장 속도 가속화

  • AI와 인간 능력 비교하는 벤치마크 모델 제시

  • 2029년에는 100가지 작업 AI 시키면 50개 인간 수준 완성

사진챗GPT 생성
[사진=챗GPT 생성]

인공지능(AI)이 처리할 수 있는 작업이 7개월마다 2배씩 증가한다는 연구 결과가 나왔다. 현재 성장 추세대로라면 오는 2029년에는 AI가 인간 전문가가 한 달(167시간) 걸리는 작업을 절반 이상 수행할 수 있을 것이라는 전망도 대두됐다. 

16일 소프트웨어정책연구소(SPRi)가 발간한 AI 브리프에 따르면, 미국 비영리 AI 연구기관 미터(METR)은 최근 '긴 작업을 완료하는 AI 능력 측정하기(Measuring AI Ability to Complete Long Tasks)'라는 보고서를 발간했다. 

보고서는 인간 능력을 기준으로 AI 능력을 정량화하기 위한 벤치마크를 제시했다. 기준은 △코딩 △사이버보안 △추론 등 다양한 분야에서 170개 작업으로 구성됐다. 

AI 능력과 인간의 능력을 비교하기 위해 연구진은 숙련된 전문가가 코딩, 사이버 보안, 추론 등 작업을 수행하는데 걸리는 시간을 측정했다. 그 다음 AI 모델의 업무 역량을 테스트했다. 그 결과 지난 2019년 오픈AI 출시한 'GPT-2'는 인간 전문가가 1분 이상 걸리는 작업 수행에 모두 실패했다. 반면 지난 2025년 2월 앤스로픽이 선보인 '클로드(Claude) 3.7 소네트(Sonnet)'의 경우 사람이 59분 걸리는 작업의 50%를 완료했다. 

보고서는 "13개 AI 모델의 시간 단축은 지난 2019년 이후 약 7개월 마다 두 배로 증가했다"며 "특히 2024년 이후 AI 성장세가 가속화해, 이후 출시한 모델로 데이터를 제한한다면 3개월마다 두 배씩 성능이 향상됐다"고 분석했다. 
 
사진Measuring AI Ability to Complete Long Tasks 보고서 갈무리
[사진=Measuring AI Ability to Complete Long Tasks 보고서 갈무리]

METR은 이 같은 진행 속도라면 오는 2029년에는 인간 전문가가 167시간(약 한 달) 걸리는 작업을 AI가 완전히 대체할 수 있는 확률이 50%에 이를 것이라 전망했다. 이는 예컨대 100가지 작업을 AI 시켰을 때 그 중 절반인 50개의 작업이 인간 수준으로 완성된다는 의미다. 특히 지난해와 올해 가속화한 발전 추세를 반영할 경우 이 시점은 약 2.5년 앞당겨질 것으로 보고서는 내다봤다. 

연구진은 성공률 80% 기준 실험에서도 유사한 지수적 추세가 관찰됐다고 설명했다. 보고서는 이번 연구가 AI 벤치마크 뿐 아니라 성능과 예측, 위험 관리에도 중요한 시사점을 제공한다고 강조했다. 특히 사람의 작업 소요 시간을 기준으로 AI의 성능을 측정해 다양한 기능 수준에서 모델의 절대적 성과를 평가할 수 있고 실제 결과와 연계성도 확보할 수 있다는 것이다. 

다만 연구진은 AI 모델이 '좋은 연구 논문 작성(write a good research paper)'과 같은 성공 기준이 불명확하거나 체계화하지 않은 복잡한 작업에서는 여전히 취약하다고 덧붙였다. 

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

고궁걷기대회_기사뷰_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기