
구글과 오픈AI, 아마존 등 인공지능(AI) 분야 선두 기업들이 최신 모델을 공개하면서 본격적인 ‘에이전트 AI’ 시대를 열었다. 에이전트 AI 시장은 2030년까지 40%가 넘는 연평균 성장률을 보일 것으로 전망되는데, 다만 AI 추론 능력의 한계점을 보여주면서 상용화가 이르다는 지적도 나오고 있다.
19일 IT 업계에 따르면, 구글 딥마인드는 지난 14일(현지시간) 자사 블로그를 통해 에이전트 AI 모델 ‘알파이볼브’를 소개했다. 딥마인드는 알파이볼브를 “진화적 코딩 에이전트”로 설명하며, 수학 및 컴퓨터 과학 분야의 실용적 응용에 필요한 알고리즘을 진화시키는 AI라고 밝혔다.
딥마인드의 알파이볼브는 구글의 대규모 언어모델(LLM) 제미나이를 기반으로 구축됐다. 알파이볼브는 50개 수학 문제를 푸는 테스트에서 75% 확률로 알려진 최고 수준의 답을 도출했으며, 20%에서는 기존 답변보다 우수한 해결책을 제시했다. 매트릭스 곱셈에서는 기존 최고 기록인 4x4 복소 행렬 곱셈(49회 계산)을 48회로 줄이며 56년 만에 기록을 경신했다. 에너지 효율에서 0.7%의 자원 절감률을 기록해 데이터센터 비용 절감에 기여했다.
오픈AI의 코덱스는 GPT-o3 추론 모델 버전인 codex-1를 기반으로 한다. 프로그램 작성 및 버그 수정과 같은 코딩 작업 테스트에서 75% 정확도를 기록했으며, 글로벌 코딩 대회 플랫폼에서 2727점을 받아 상위 0.2%에 들었다.
일반 사용자를 위한 에이전트 AI도 곧 출시된다. 아마존은 지난 3월 31일 웹브라우저에서 자율적으로 작업을 수행하는 에이전트 AI ‘노바 액트’를 선공개했다. 노바 액트는 자연어 명령을 통해 웹사이트를 탐색하며 양식을 채우는 ‘디지털 비서’ 역할을 한다. 아마존에 따르면, 노바 액트는 텍스트 기반 UI 상호작용에서 94% 정확도를 기록했으며, 날짜 선택, 드롭다운, 팝업 등 복잡한 UI 요소에서도 90% 이상의 성공률을 달성했다.
에이전트 AI는 자율적으로 작업을 수행하거나 의사결정을 내릴 수 있는 AI 시스템을 의미한다. 한국개발연구원(KDI)은 지난달 발표한 ‘AI 에이전트 개발 동향 및 국내 경쟁력 분석’ 보고서에서 글로벌 에이전트 AI 시장이 2030년까지 연평균 44.8% 성장할 것으로 전망했다.
다만 업계는 에이전트 AI 출시에 대해 신중한 입장이다. 알파이볼브는 경쟁사 대비 낮은 0.7% 환각률을 기록했으나, 복잡하거나 문맥이 긴 텍스트에서는 환각 확률이 급격히 증가하는 문제를 갖고 있다. 특히, 20만 토큰 이상의 대규모 컨텍스트에서 환각 확률이 높은 것으로 알려졌다. 코덱스의 기반 모델 역시 실제 소프트웨어 작업 테스트에서 30~40% 정확도를 보여, IT 현장 투입에는 한계가 있다는 평가다.
AI 스타트업 대표는 “에이전트 AI는 개발자를 보조하는 유용한 도구지만, 아직 신뢰도가 높지 않고 문제가 발생했을 때 대응이 어렵다”며 “베테랑 개발자의 검수 작업이 늘어나 오히려 개발 속도를 저하시킬 수 있다”고 밝혔다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지