“‘이제 우리 밥그릇은 어찌하나’ 푸념이 나오기 시작했습니다.”
텍스트를 최대 1분 분량의 영상으로 구현하는 오픈에이아이(OpenAI)의 새 인공지능 모델 ‘소라’(Sora) 출시로 광고·영상 업계가 술렁인다. 업계에선 1분 내외 짧은 영상(숏폼)이나 광고 영상을 제작하는 업체들이 “직격탄을 맞을 것”이라는 전망이 나온다.
오픈에이아이는 지난 15일(현지시각) 블로그를 통해 “문자 기반 영상 생성 모델(text-to-video model) 소라를 소개한다”며 “여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이 영상을 빠르게 제작할 수 있다”고 밝혔다. 다만, 소라는 일단 ‘제한된 수의 창작자’만 사용할 수 있도록 허용된다고, 샘 올트만 오픈에이아이 최고경영자가 엑스(X·옛 트위터)에서 밝혔다.
오픈에이아이는 소라가 기존 인공지능 영상 생성 도구와 가장 차별화한 지점으로 “실제 세계에 사물이 어떻게 존재하는지 이해한다”는 점을 들었다. 오픈에이아이는 “(소라는) 언어에 대한 깊은 이해를 갖고 있어, 프롬프트(지시말)를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”며 “사용자가 프롬프트에서 요구한 것뿐만 아니라 프롬프트 내용이 물리적 세계에 어떻게 존재하는지 이해한다”고 설명했다. 가령 ‘중국 용(Chinese Dragon)과 함께하는 중국 음력 설날 축하 영상’이라는 내용을 프롬프트에 입력하면, 춘제를 기념하기 위해 거리로 나온 수많은 사람이 용 탈과 빨간 깃발을 들고 걸어가는 영상이 생성되는 식이다.
또한 오픈에이아이는 “소라는 하나의 영상 안에서 특정 캐릭터, 시각적 스타일을 유지할 수 있다”고 설명했다.