GPT-4.1 대비 성능 우수…라이너, 검색 LLM 평가 결과 공개

사진라이너
[사진=라이너]

인공지능(AI) 검색 스타트업 라이너(Liner)가 ‘라이너 검색 거대언어모델(LLM)’이 AI 검색 답변 생성에 사용되는 핵심 컴포넌트 평가에서 오픈AI의 GPT-4.1 모델보다 우수한 결과를 기록했다고 3일 밝혔다.

라이너 검색 LLM은 사용자 질문을 분석하고 처리하는 데 필요한 8가지 핵심 컴포넌트를 통합해 자체 개발한 모델이다. 각 컴포넌트는 오픈 소스 모델을 기반으로, 10여 년간 축적한 라이너의 사용자 데이터를 사후 학습(Post-training)해 정밀하게 설계됐다.

라이너는 동일한 태스크(Task)를 기준으로 체계적인 내부 검증 프로세스를 통해 오픈AI의 GPT-4.1과 성능(정확도), 처리 속도, 비용(토큰당 가격)을 비교 분석했다. 

그 결과 △카테고리 분류(Category_Classification) △과제 분류(Classify_Homework) △외부 도구 실행(Execute_Task_with_External_Tools) △중간 답변 생성(Create_Intermediate_Answer) 4개 핵심 컴포넌트에서는 성능·속도·비용 모든 측면에서 GPT 4.1을 능가하는 결과가 나왔다. 또한 △질문 분해 여부 판단(Decide_Query_Decomposability) △필요 문서 식별(Extract_Necessary_Document_Ids) △출처 포함 중간 답변 생성(Create_Intermediate_Answer_with_Reference) △할 일 관리(Todo_Maker) 4개 컴포넌트에서도 두 가지 이상 항목에서 경쟁 우위를 기록했다.

조현석 라이너 테크 리드는 “라이너 검색 LLM은 8가지 모든 컴포넌트에서 GPT를 뛰어넘는 성능을 입증했다”며 “데이터 학습과 연구 개발에 꾸준히 집중해 온 노력이 차별화된 AI 에이전트 기술 경쟁력으로 이어졌다는 점에서 의미가 있다"고 평가했다. 

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
댓글0
0 / 300

댓글을 삭제 하시겠습니까?

닫기

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기