또 흑갈색의 고양이 사진을 업로드한 뒤 ‘누군가를 향해 쳐다본 다음 잔디밭을 거니는 고양이의 모습을 보여줘’라고 명령했더니, 이내 이미지가 다큐멘터리 속 한 장면으로 재탄생했다.
포토샵으로 유명한 콘텐츠 제작 소프트웨어(SW) 전문 기업 어도비가 자사의 생성형 인공지능(AI) 모델군 ‘파이어플라이’로 구동되는 비디오 AI를 전격 공개했다. 지난해 텍스트를 이미지로 변환해 주는 이미지 AI를 내놓은 이후 시장으로부터 큰 호평을 받았던 어도비는 이번 비디오 AI를 통해서도 포토샵으로부터 시작된 ‘창작 맛집’의 자존심을 다시한 번 보여주겠다는 각오다.
샨타누 나라옌(Shantanu Narayen) 어도비 최고경영자(CEO)는 14일(현지시간) 미국 플로리다주 마이애미에서 열린 세계 최대 규모의 크리에이티브 콘퍼런스 ‘어도비 맥스 2024’(Adobe MAX 2024) 무대에 올라 “어도비는 생성형 AI가 갖고 있는 잠재력과 이것이 (창작자들을 지원할) 강력한 가능성으로 발현되고 있다는 것을 (누구보다도 더 깊이) 인지하고 지원에 앞장서고 있다”고 밝혔다.
그러면서 그는 “파이어플라이는 어도비의 제품군 전반에 탑재되며 빠르게 진화해 나가고 있고, 그 안에서 많은 창작자들이 생성형 AI와 함꼐 일하는 방식의 새로운 접근법과 업무 과정의 간소화를 경험하며 종전보다 더욱 풍성해진 창의성을 경험하고 있다”고 강조했다.
이날 현장의 주목도가 높았던 것은 어도비의 새로운 동영상 AI 모델인 ‘파이어플라이 비디오 모델’(Firefly Video Model)이었다. 앞서 선공개됐던 오픈AI의 ‘소라’(Sora)와 구글의 ‘비오’(Veo) 및 메타의 ‘무비 젠’(Movie Gen)을 겨냥한 듯 어도비는 이들 모델의 불확실한 요소인 ‘저작권 논란’을 정조준했다. 기본적으로 업계 유사 모델 이상의 우수한 성능을 가졌다는 점을 언급하면서도 무엇보다 저작권 침해 가능성이 전혀 없는 데이터만을 원천 학습용으로 사용했다는 대목을 거듭 강조했다.
데이비드 와드와니(David Wadhwani) 어도비 디지털 미디어 사업 부문 사장은 “파이어플라이 비디오 모델은 상업적으로 안전하게 만들어진 (업계) 첫번째 동영상 AI”라며 “다른 타사 모델과 달리 어도비는 (사용 권한을 가진) 보장된 콘텐츠 만을 AI 학습 데이터로 활용하고 있고, 이것이 타 사와의 차별화 지점”이라고 말했다. 이와 관련해 어도비는 이번 파이어플라이 비디오 모델을 구축하면서 필요한 영상 데이터를 창작자들로부터 대거 사들이기도 했다.
생성형 확장 기능은 영상 컷과 컷 사이로 발생한 공백을 앞뒤 흐름에 맞게 간극을 채워주는 비디오 생성 AI 솔루션으로, 오디오 클립을 확장하는 경우에도 배경음을 자연스럽게 연결해주기까지 한다.
디파 수브라마니암(Deepa Subramaniam) 어도비 크리에이티브 클라우드 부문 제품 마케팅 부사장은 “추가 영상 촬영 없이도 비디오에서 발생한 간극을 AI가 자동으로 메워주는 역할을 하는 것이 생성형 확장”이라며 “그동안 영상 제작자들이 가장 힘들어하고 요청이 많았던 솔루션이기도 하다”고 설명했다.
어도비에 따르면 ‘텍스트를 영상으로’를 사용하면 한층 세분화된 글자 입력만으로 비디오를 만들어 낼 수 있고 이 과정에서 각도와 모션, 줌, 등 다양한 카메라 컨트롤까지 미세 조정하며 이미지를 참조해 타임라인의 빈 공간을 매끄럽게 메울 수 있는 ‘B-Roll’(비롤)을 생성할 수 있다. 또한 ‘이미지를 영상으로’는 정적인 형태의 스틸 사진이나 일러스트를 동적인 실사(비디오)로 변환해 준다.