인공지능(AI)가 연구개발 영역에서 보조 수준을 넘어 과정 전체를 수행할 수 있다는 논문이 게재되면서, 과학계의 주목을 받았다.
29일 IT업계에 따르면 지난 25일 과학저널 네이처에 일본의 AI 스타트업 사카나 AI가 주도한 연구가 게재됐다.
‘인공지능 연구의 엔드투엔드 자동화를 향하여’라는 주제의 해당 논문은 사카나 AI가 개발한 ‘더 AI 사이언티스트’ 시스템을 중심으로, 연구 아이디어 생성부터 실험 설계·실행, 결과 해석, 논문 집필, 그리고 피어 리뷰까지 과학 연구의 전 과정을 AI 에이전트가 거의 독립적으로 수행하는 워크플로우를 체계를 제시한다.
주목할 만한 성과는 이 시스템이 생성한 논문 하나가 지난해 국제학습표현회의 워크숍에 제출돼 인간 피어 리뷰를 통과한 점이다. 해당 논문은 1차 리뷰에서 평균 점수 6.33을 기록하며 워크숍 수용 기준을 충족했다. 인간 연구자들이 작성한 논문 중 상위 약 55% 수준에 해당하는 성적이다. AI가 완전히 생성한 연구 결과물이 인간 중심의 탑티어 학회 워크숍에서 1차 통과한 것은 이번이 처음으로 알려져 있다.
해당 기술은 두 가지 모드로 작동한다. 하나는 인간이 미리 만들어준 기본 코드와 구조를 활용하는 ‘템플릿 기반 모드’이고, 다른 하나는 처음부터 자유롭게 탐색하는 ‘템플릿-프리(완전 개방형) 모드’다.
실험 과정에서는 여러 가능성을 동시에 검토하며 하이퍼파라미터(학습 설정값) 조정, 성능 비교 실험, 오류 수정 등을 자동으로 병렬 처리한다. 논문 작성 단계에서는 그래프와 그림의 정확성과 보기 편함을 비전 언어 모델(VLM)이 검토해 피드백을 주고, 그에 따라 자동으로 수정한다.
‘자동 리뷰어’ 모듈은 여러 LLM(대형언어모델)의 리뷰를 모아 메타 리뷰를 생성한다. 이 자동 리뷰어는 인간 리뷰어와 비교했을 때 69% 수준의 정확도를 보였으며, 일부 지표에서는 인간 리뷰어 간 일치율을 넘어서는 성능을 나타냈다. 이는 AI가 연구의 질을 스스로 평가하는 능력도 점차 인간 수준에 접근하고 있음을 시사한다.
아직 한계는 분명하다. 이 시스템은 주로 머신러닝 분야의 계산 실험에 국한되며, 복잡한 실험 설계나 깊은 이론적 통찰이 필요한 영역에서는 인간 연구자의 개입이 여전히 필요하다. 환각 현상으로 잘못된 인용이나 중복된 그래프가 생성되기도 하고, 아이디어가 다소 단순하거나 기존 연구와 큰 차별성이 부족한 경우도 관찰됐다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지



![[르포] 중력 6배에 짓눌려 기절 직전…전투기 조종사 비행환경 적응훈련(영상)](https://image.ajunews.com/content/image/2024/02/29/20240229181518601151_258_161.jpg)



