지난 9일(현지시간) 오픈AI의 동영상 생성 인공지능(AI)인 소라가 전격 출시됐다. 높은 관심을 반영하듯 공개한 지 얼마 되지 않아 이용자가 몰리며 한동안 로그인이 어렵다는 공지가 떴다. 이후 3일 만에 서비스가 재개되고 써본 소라는 실제와 거의 구별되지 않는 영상을 수 분 내로 간단하게 생성해 낸다는 점만으로도 인상적이었다.
챗GPT처럼 프롬프트(명령어)를 입력하는 창에 "남자가 집에서 컴퓨터를 보며 웃는 모습"이라고 입력하자 약 1분 만에 알아서 영상을 만들어 준다. 간단한 지시만으로 영상의 전반적인 구도와 주위 배경을 알아서 설정한다. '캡션 확장' 기능을 쓰면 AI가 프롬프트를 보다 구체적으로 제안한다. 이렇게 만든 영상은 실제와 거의 구별이 되지 않았다. 우측 하단에 AI가 만들었음을 표시하는 워터마크가 있었지만 크게 눈에 띄지는 않았다.
일상적 내용뿐만 아니라 시대적 배경을 담은 영상을 요구해도 괜찮은 결과물을 만든다. 1980년대 한국 대학생들이 대학교 캠퍼스에서 시위하는 장면을 요청하자 다소 레트로한 옷을 입은 사람들이 캠퍼스로 보이는 공간에서 피켓시위를 하는 영상을 생성했다. 애초 생각했던 격렬한 시위의 모습은 아니었지만 어느 정도 걸맞은 영상을 만들었다. "조선시대 선비가 숲길을 걷고 있다"는 명령어를 입력하자 갓을 쓰고 도포를 입는 등 실제 선비를 연상케 하는 옷을 입은 인물이 등장했다.
이용자가 찍은 사진이나 영상을 활용하는 것도 가능하다. 프롬프트를 추가로 입력하면 기존 사진·영상에 비교적 자연스럽게 변화를 줄 수 있다는 점도 재미 요소다. 완성된 영상에 명령어를 추가로 입력해 연출을 달리 하거나 두 영상을 합치는 등 편집도 간단하게 할 수 있다.
다만 사람의 역동적이고 복잡한 움직임을 구현하는 데는 한계를 드러냈다. 가령 축구를 하는 소년의 영상을 생성하자 공을 드리블하는 소년이 마치 미끄러지듯이 달려 어색했다. 슬로모션을 하듯 느릿느릿한 움직임도 거슬렸다. "남자가 공중제비 두 바퀴를 돌다가 바닥에 넘어짐"이라고 입력하자 몸을 배배 꼬며 손과 발이 부자연스럽게 뒤틀리는 모습이 나왔다. 발이 갑자기 손으로 바뀌기도 했다.
프롬프트를 영어와 한국어로 각각 입력했을 때 품질 차이도 확연했다. 한국어로 입력했을 경우 의도와 다른 결과물을 내놓는 경우도 종종 있었다. "반바지를 입은 남자가 길을 걷고 있다"고 입력하면 갑자기 정장을 입고 가면을 쓴 남자가 등장하는 식이다. 같은 내용을 영어로 입력하자 문제는 바로 해결됐다. 한국어에 대해서는 아직 더 많은 학습이 필요한 것으로 보였다.
크리스티아누 호날두, 윤석열 등 실제 유명인을 프롬프트에 입력하면 자동으로 "유명한 축구 선수", "중년의 아시아인"과 같은 식으로 전환한다. 오픈AI의 생성 AI 윤리 가이드라인에 따라 실제 인물·사건 등이 등장하는 영상 생성이 제한되기 때문이다. 이러한 생성 AI 가이드라인과 워터마크 삽입 등으로 딥페이크 등 부작용 예방에 나름대로 신경을 쓰고자 했다.
이처럼 세부적인 면에서는 다소 아쉬운 모습도 적잖았지만 실제와 흡사한 실감나는 영상을 단 1~2분 만에 쉽게 만들 수 있다는 점만으로도 소라를 쓸 이유는 충분해 보였다. 챗GPT 플러스(월 20달러) 이용자는 월 최대 50개의 480p 영상을 만들 수 있으며, 챗GPT 프로(월 200달러) 이용자는 최대 500개의 1080p 영상 생성이 가능하다. 챗GPT 플러스 이용자는 한 번에 최대 10초, 챗GPT 프로는 최대 20초의 영상 제작이 가능하다.