AI, R&D도 자동화… 과학자 자리도 넘본다

김성현 기자입력 2026-03-29 17:02

기사공유
폰트크기

AI에이전트가 스스로 연구 아이디어 내고 검증까지 수행

AI로 만든 이미지 사진MS코파일럿 — AI로 만든 이미지 [사진=MS코파일럿]

인공지능(AI)가 연구개발 영역에서 보조 수준을 넘어 과정 전체를 수행할 수 있다는 논문이 게재되면서, 과학계의 주목을 받았다.

29일 IT업계에 따르면 지난 25일 과학저널 네이처에 일본의 AI 스타트업 사카나 AI가 주도한 연구가 게재됐다.

‘인공지능 연구의 엔드투엔드 자동화를 향하여’라는 주제의 해당 논문은 사카나 AI가 개발한 ‘더 AI 사이언티스트’ 시스템을 중심으로, 연구 아이디어 생성부터 실험 설계·실행, 결과 해석, 논문 집필, 그리고 피어 리뷰까지 과학 연구의 전 과정을 AI 에이전트가 거의 독립적으로 수행하는 워크플로우를 체계를 제시한다.

관련기사

기존 AI 기술은 과학 연구에서 문헌 검색, 데이터 분석, 코드 생성 등 일부 과정을 지원하는 데 그쳤다. 더 AI 사이언티스트는 기초모델을 기반으로 한 다중 에이전트 구조를 통해 연구 전 주기를 하나의 연결된 파이프라인으로 자동화했다. 구체적으로 △문헌 검색과 신규성 판단을 통한 아이디어 생성 △실험 코드 작성과 병렬 실행 △결과 분석 및 그래프 생성 △LaTeX 형식의 완전한 논문 작성 △자동 리뷰어 모듈을 통한 자기 검증까지 수행한다.

주목할 만한 성과는 이 시스템이 생성한 논문 하나가 지난해 국제학습표현회의 워크숍에 제출돼 인간 피어 리뷰를 통과한 점이다. 해당 논문은 1차 리뷰에서 평균 점수 6.33을 기록하며 워크숍 수용 기준을 충족했다. 인간 연구자들이 작성한 논문 중 상위 약 55% 수준에 해당하는 성적이다. AI가 완전히 생성한 연구 결과물이 인간 중심의 탑티어 학회 워크숍에서 1차 통과한 것은 이번이 처음으로 알려져 있다.

해당 기술은 두 가지 모드로 작동한다. 하나는 인간이 미리 만들어준 기본 코드와 구조를 활용하는 ‘템플릿 기반 모드’이고, 다른 하나는 처음부터 자유롭게 탐색하는 ‘템플릿-프리(완전 개방형) 모드’다.

실험 과정에서는 여러 가능성을 동시에 검토하며 하이퍼파라미터(학습 설정값) 조정, 성능 비교 실험, 오류 수정 등을 자동으로 병렬 처리한다. 논문 작성 단계에서는 그래프와 그림의 정확성과 보기 편함을 비전 언어 모델(VLM)이 검토해 피드백을 주고, 그에 따라 자동으로 수정한다.

‘자동 리뷰어’ 모듈은 여러 LLM(대형언어모델)의 리뷰를 모아 메타 리뷰를 생성한다. 이 자동 리뷰어는 인간 리뷰어와 비교했을 때 69% 수준의 정확도를 보였으며, 일부 지표에서는 인간 리뷰어 간 일치율을 넘어서는 성능을 나타냈다. 이는 AI가 연구의 질을 스스로 평가하는 능력도 점차 인간 수준에 접근하고 있음을 시사한다.

아직 한계는 분명하다. 이 시스템은 주로 머신러닝 분야의 계산 실험에 국한되며, 복잡한 실험 설계나 깊은 이론적 통찰이 필요한 영역에서는 인간 연구자의 개입이 여전히 필요하다. 환각 현상으로 잘못된 인용이나 중복된 그래프가 생성되기도 하고, 아이디어가 다소 단순하거나 기존 연구와 큰 차별성이 부족한 경우도 관찰됐다.

김성현 기자minus1@ajunews.com

기자의 다른기사

AI, R&D도 자동화… 과학자 자리도 넘본다

AI에이전트가 스스로 연구 아이디어 내고 검증까지 수행