업스테이지는 인공지능(AI) 광학문자인식(OCR) 분야 국제 경진 대회인 'ICDAR 로버스트 리딩 컴피티션'에서 4개 종목 1위를 기록했다고 24일 밝혔다. 로버스트 리딩은 디지털 이미지와 비디오 상에서 텍스트를 감지·인식하는 기술을 말한다.
국제패턴인식협회(IAPR)가 주관하는 이 대회에는 문서 분석·인식 관련 글로벌 기업과 연구자·전문가들이 참여한다. 지난 1991년을 시작으로 매해 열리고 있다.
이번에 업스테이지가 대회 1위를 차지한 종목은 Hier텍스트1과 2, VQAonBD, IHTR 등 4개다. 이는 아마존·엔비디아·알리바바·화웨이 등 글로벌 빅테크 기업들을 제친 성과다.
새로운 방법론을 활용한 덕분이다. 업스테이지 관계자는 "단어 영역은 조금 줄이는 대신 단어 영역 사이에 갭을 넣어 학습에 활용하면서 단어 상자를 예측하는 방식으로 모델 성능을 대폭 개선했다"고 말했다. 이를 통해 신설된 평가 기준인 예측된 박스와 정답 박스 사이의 유사도(tightness)를 크게 향상했다는 설명이다.
김성훈 업스테이지 대표는 "ICDAR 로버스트 리딩 컴피티션에서 4개 부문 1위를 휩쓸며 다시 한 번 당사가 글로벌 톱 AI 기술력을 인정 받았다"며 "세계 최고의 기술력이 검증된 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 말했다.
국제패턴인식협회(IAPR)가 주관하는 이 대회에는 문서 분석·인식 관련 글로벌 기업과 연구자·전문가들이 참여한다. 지난 1991년을 시작으로 매해 열리고 있다.
이번에 업스테이지가 대회 1위를 차지한 종목은 Hier텍스트1과 2, VQAonBD, IHTR 등 4개다. 이는 아마존·엔비디아·알리바바·화웨이 등 글로벌 빅테크 기업들을 제친 성과다.
새로운 방법론을 활용한 덕분이다. 업스테이지 관계자는 "단어 영역은 조금 줄이는 대신 단어 영역 사이에 갭을 넣어 학습에 활용하면서 단어 상자를 예측하는 방식으로 모델 성능을 대폭 개선했다"고 말했다. 이를 통해 신설된 평가 기준인 예측된 박스와 정답 박스 사이의 유사도(tightness)를 크게 향상했다는 설명이다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지