
카카오브레인이 실사 같은 고해상도 이미지를 3초 안에 그려내는 초거대 인공지능(AI) 이미지 생성 모델 ‘칼로(Karlo) 2.0’을 10일 공개했다. 텍스트와 짝지은 이미지 3억장 규모 데이터세트를 학습해 사용자가 언어로 주문한 그림을 고화질로 빠르게 생성한다.
칼로 2.0은 ‘눈동자가 밝고 파란 고양이(A cat has light blue eyes)’와 같은 명령어(프롬프트)를 이해하고 최대 2048×2048 픽셀 크기로 이미지를 만든다. 이미지의 공간감, 입체감, 동물의 털과 같은 텍스처를 표현하는 세밀함이 기존 모델 ‘칼로 1.4’보다 보강됐고 이미지 생성 속도도 빨라졌다.
카카오브레인은 ‘카카오디벨로퍼스’에 칼로 2.0 오픈 API를 공개했다. 이는 기존 칼로 1.4 모델 오픈 API보다 다양한 크기와 비율로 이미지를 생성하고 향상된 명령어 이해도를 갖췄다. 제외해야 할 표현과 키워드를 부정 명령어(Negative Prompt)로 제어할 수 있다. 개발자는 이것으로 무료 이미지를 60만장까지 만들 수 있다.
김일두 카카오브레인 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “실사 수준 이미지를 생성하고 다양한 사용자 요구를 반영하는 이미지 생성 모델로 발전시키겠다”고 말했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지