카카오브레인, AI화가 '칼로 2.0' 공개… "실사 같은 그림 3초면 생성"

기자정보, 기사등록일
임민철 기자
입력 2023-07-10 09:41
    도구모음
  • 글자크기 설정
  • 칼로 2.0 오픈API 통해 무료 이미지 60만장까지 생성 가능

칼로 20 모델을 사용해 생성한 이미지 사진카카오브레인
칼로 2.0 모델을 사용해 생성한 '눈동자가 밝고 파란 고양이' 이미지 [사진=카카오브레인]

카카오브레인이 실사 같은 고해상도 이미지를 3초 안에 그려내는 초거대 인공지능(AI) 이미지 생성 모델 ‘칼로(Karlo) 2.0’을 10일 공개했다. 텍스트와 짝지은 이미지 3억장 규모 데이터세트를 학습해 사용자가 언어로 주문한 그림을 고화질로 빠르게 생성한다.

칼로 2.0은 ‘눈동자가 밝고 파란 고양이(A cat has light blue eyes)’와 같은 명령어(프롬프트)를 이해하고 최대 2048×2048 픽셀 크기로 이미지를 만든다. 이미지의 공간감, 입체감, 동물의 털과 같은 텍스처를 표현하는 세밀함이 기존 모델 ‘칼로 1.4’보다 보강됐고 이미지 생성 속도도 빨라졌다.

카카오브레인은 ‘카카오디벨로퍼스’에 칼로 2.0 오픈 API를 공개했다. 이는 기존 칼로 1.4 모델 오픈 API보다 다양한 크기와 비율로 이미지를 생성하고 향상된 명령어 이해도를 갖췄다. 제외해야 할 표현과 키워드를 부정 명령어(Negative Prompt)로 제어할 수 있다. 개발자는 이것으로 무료 이미지를 60만장까지 만들 수 있다.

김일두 카카오브레인 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “실사 수준 이미지를 생성하고 다양한 사용자 요구를 반영하는 이미지 생성 모델로 발전시키겠다”고 말했다.
 
칼로 14 모델로 생성한 이미지왼쪽와 20 모델로 생성한 이미지 사진카카오브레인
칼로 1.4 모델로 생성한 이미지(왼쪽)와 2.0 모델로 생성한 이미지 [사진=카카오브레인]

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
실시간 인기
기사 이미지 확대 보기
닫기