비오, 간단한 텍스트∙이미지만으로 고화질 동영상 빠르게 생성… 마케팅 및 제작 프로세스 획기적 단축
디지털 워터마킹, 안전 필터, 데이터 거버넌스 등 엔터프라이즈급 보안 및 안전성 지원

구글 클라우드가 구글의 최신 동영상 생성 모델인 비오(Veo)와 최고 품질의 이미지 생성 모델인 이마젠 3(Imagen 3)를 버텍스 AI(Vertex AI)를 통해 고객에게 제공한다고 밝혔다.

구글 클라우드는 3일부터 비오를 버텍스 AI에서 프라이빗 프리뷰(private preview)로 제공한다. 비오는 고객이 간단한 텍스트나 이미지 프롬프트를 통해 고품질 동영상을 손쉽게 생성할 수 있도록 지원한다. 구글 클라우드는 이미지 기반 동영상 생성(image-to-video) 모델을 제공하는 최초의 하이퍼스케일러(hyperscaler) 기업으로서, 동영상 제작 워크플로를 간소화하고 기업이 기존의 크리에이티브 자산을 역동적인 영상 콘텐츠로 전환하며 창의적 표현의 새로운 가능성을 열 수 있도록 지원한다.

또한 다음 주부터 이마젠 3를 모든 버텍스 AI 고객에게 제공한다. 이마젠 3는 단순한 텍스트 프롬프트를 통해 사실적인 고품질의 이미지를 생성하고, 이전 버전 대비 뛰어난 디테일과 조명 표현, 아티팩트 감소량을 자랑한다.

버텍스 AI는 기업 고객이 AI 모델을 간편하게 커스터마이징하고, 성능을 평가하며, 주요 인프라에 배포할 수 있도록 지원하는 오케스트레이션 플랫폼을 제공한다. 버텍스 AI에서 제공되는 비오와 이마젠 3의 개발 및 배포는 구글의 AI 원칙에 따라 디지털 워터마킹, 안전 필터, 데이터 거버넌스와 같이 기본으로 제공되는 보호 기능을 통해 안전과 책임을 우선시하도록 설계됐다.

고성능 동영상 생성 모델 ‘비오’를 이제 버텍스 AI에서

구글 딥마인드(Google DeepMind)에서 개발한 비오는 텍스트 또는 이미지 프롬프트를 기반으로 다양한 영화적, 시각적 스타일의 고화질 동영상을 빠르게 생성한다. 비오는 자연어와 시각적 의미에 대한 뛰어난 이해를 바탕으로 프롬프트와 밀접하게 부합하는 동영상을 생성해 사람, 동물, 사물이 영상 전반에서 사실적으로 움직이도록 일관성 있고 자연스러운 영상을 제작할 수 있다.

비오는 기존 이미지 또는 AI가 생성한 이미지를 기반으로 영상을 생성한다.

오가 이마젠 3로 생성한 이미지를 바탕으로 생성한 영상 클립 예시(좌측) 프롬프트: 남자가 카메라를 향해 고개를 들고 웃는다(우측) 프롬프트: 강아지가 일어나서 꼬리를 흔들면서 카메라를 행복하게 바라본다
오가 이마젠 3로 생성한 이미지를 바탕으로 생성한 영상 클립 예시(좌측) 프롬프트: 남자가 카메라를 향해 고개를 들고 웃는다(우측) 프롬프트: 강아지가 일어나서 꼬리를 흔들면서 카메라를 행복하게 바라본다
비오가 실제 이미지를 바탕으로 생성한 영상 클립 예시(좌측) 프롬프트:  지글거리는 불 위로 마시멜로가 구워지고 있는 모습의 슬로 모션(우측) 프롬프트: 환호하는 관중 속에서 한 여성이 EDM 콘서트의 생생한 현장을 담은 사진을 찍는 모습. 관중들은 노래를 부르면서 뛰고 있고, 콘페티가 공기 중에 날리면서 연기가 군중 사이로 퍼진다.
비오가 실제 이미지를 바탕으로 생성한 영상 클립 예시(좌측) 프롬프트: 지글거리는 불 위로 마시멜로가 구워지고 있는 모습의 슬로 모션(우측) 프롬프트: 환호하는 관중 속에서 한 여성이 EDM 콘서트의 생생한 현장을 담은 사진을 찍는 모습. 관중들은 노래를 부르면서 뛰고 있고, 콘페티가 공기 중에 날리면서 연기가 군중 사이로 퍼진다.
비오가 텍스트를 사용해 생성한 영상 클립 예시(좌측) 프롬프트: 북실한 털로 덮인 발이 일렉트릭 기타의 줄을 튕기면서 연주하는 모습을 클로즈업으로 찍은 첫 장면으로 시작한다.  더치 앵글 샷으로 전환해 선글라스를 쓴 곰인형이 정글을 배경으로 기타를 연주하며 춤을 춘다. 마지막으로 광각 샷으로 헤드뱅잉하는 곰의 배경으로 폭포가 보인다.(우측) 프롬프트: 해 질 녘에 역동적으로 파도치는 바다를 홀로 항해하는 보트 한 척. 역동적인 트래킹 샷으로 붉은 하늘을 배경으로 하얀 돛을 휘날리며 힘차게 파도를 헤쳐나가는 보트를 따라간다. 슬로 모션으로 파도의 힘과 보트의 우아함을 강조하고, 보트의 작은 크기와 광활한 바다가 주는 대비감을 강조해 위험성과 경외감을 동시에 자아낸다.
비오가 텍스트를 사용해 생성한 영상 클립 예시(좌측) 프롬프트: 북실한 털로 덮인 발이 일렉트릭 기타의 줄을 튕기면서 연주하는 모습을 클로즈업으로 찍은 첫 장면으로 시작한다. 더치 앵글 샷으로 전환해 선글라스를 쓴 곰인형이 정글을 배경으로 기타를 연주하며 춤을 춘다. 마지막으로 광각 샷으로 헤드뱅잉하는 곰의 배경으로 폭포가 보인다.(우측) 프롬프트: 해 질 녘에 역동적으로 파도치는 바다를 홀로 항해하는 보트 한 척. 역동적인 트래킹 샷으로 붉은 하늘을 배경으로 하얀 돛을 휘날리며 힘차게 파도를 헤쳐나가는 보트를 따라간다. 슬로 모션으로 파도의 힘과 보트의 우아함을 강조하고, 보트의 작은 크기와 광활한 바다가 주는 대비감을 강조해 위험성과 경외감을 동시에 자아낸다.

기업은 버텍스 AI에서 비오를 활용해 간단한 텍스트 또는 이미지 프롬프트로 고품질 비디오를 손쉽게 생성할 수 있다. 이를 통해 제작 시간을 단축하고 비용을 절감하면서도, 비디오 콘텐츠를 빠르게 시범 제작하거나 반복할 수 있다. 비오의 기술력은 작업자가 더 높은 수준의 작업에 집중할 수 있게 돕고, 동영상 제작 과정의 지루하거나 반복적인 작업을 AI로 처리할 수 있게 도와준다. 이러한 기술력을 바탕으로 인간의 창의성을 위한 훌륭한 파트너의 역할을 제공한다. 눈길을 끄는 SNS 게시물을 제작하는 마케터나, 설득력 있는 프레젠테이션을 만드는 영업팀, 혹은 새로운 콘셉트를 모색하는 제작팀에게 비오는 워크플로를 간소화하고 시각적 스토리텔링의 새로운 가능성을 열어주는 파트너가 되어 준다.

버텍스 AI에서 최고 품질의 이미지 생성 모델 이마젠 3 정식 제공

이마젠 3는 최고 품질의 텍스트 기반 이미지 생성 모델로, 뛰어난 수준의 디테일을 갖춘 사실적이고 생생한 이미지를 제작할 수 있으며, 시각적 오류 역시 이전 모델 대비 크게 감소했다. 다음 주부터 모든 구글 클라우드 고객은 버텍스 AI에서 이마젠 3를 사용할 수 있으며 이를 통해 간단한 텍스트 프롬프트로 고해상도 이미지와 동영상을 생성할 수 있다.

(좌측) 프롬프트: 자동차 보닛 위에서 행복한 표정을 짓고 있는 고등학교 친구들의 모습을 담은 폴라로이드 사진. 1960 년대 후반의 미국 배경에, 플래시 사진 기법 느낌으로.(우측) 프롬프트: 희미한 조명의 재즈 클럽에서 소울풀한 색소폰 연주가가 얼굴을 찡그린 채 집중하며 음악을 통해 자신의 소울을 쏟아내고 있는 모습을 클로즈업 샷으로 보여주는 이미지. 소규모의 사람들이 모여 연주에 집중한 채 여러 감정을 느끼는 모습.
(좌측) 프롬프트: 자동차 보닛 위에서 행복한 표정을 짓고 있는 고등학교 친구들의 모습을 담은 폴라로이드 사진. 1960 년대 후반의 미국 배경에, 플래시 사진 기법 느낌으로.(우측) 프롬프트: 희미한 조명의 재즈 클럽에서 소울풀한 색소폰 연주가가 얼굴을 찡그린 채 집중하며 음악을 통해 자신의 소울을 쏟아내고 있는 모습을 클로즈업 샷으로 보여주는 이미지. 소규모의 사람들이 모여 연주에 집중한 채 여러 감정을 느끼는 모습.
(좌측) 프롬프트: 네덜란드 황금시대 스타일의 유화로, 다양한 꽃이 만개한 꽃다발이 장식되어 있고 창문을 통해 햇빛이 들어오는 이미지(우측) 프롬프트: 화창한 날 언덕 위에서 초원을 바라보는 두 사람의 모습을 담은 코믹 만화 스타일의 이미지
(좌측) 프롬프트: 네덜란드 황금시대 스타일의 유화로, 다양한 꽃이 만개한 꽃다발이 장식되어 있고 창문을 통해 햇빛이 들어오는 이미지(우측) 프롬프트: 화창한 날 언덕 위에서 초원을 바라보는 두 사람의 모습을 담은 코믹 만화 스타일의 이미지

나아가 구글 클라우드는 고객이 비즈니스 요건에 맞게 이미지를 편집하고 맞춤 설정하도록 지원하는 새로운 기능을 허용 목록(allowlist)에 등록된 고객을 대상으로 제공한다고 밝혔다. 이마젠 3는 모든 이미지를 다듬고 맞춤화할 수 있는 강력한 편집 기능을 사용자 친화적인 방법으로 제공한다. 간단한 텍스트 프롬프트로 사진을 편집하거나, 제품의 배경 업데이트를 포함해 마스크 기능을 기반으로 이미지의 일부만 편집하거나, 필요한 크기에 맞춰 이미지를 확대 조정할 수 있다.

또한 이마젠 3의 커스터마이즈(Customization) 기능을 통해 더욱 강력한 제어 기능을 제공하며 모델이 원하는 특성을 가진 이미지를 생성하도록 설정할 수 있게 지원한다. 고객은 새로운 이미지를 생성할 때 브랜드, 스타일,로고, 주제 또는 제품 특징을 직접 입력할 수 있으며, 이를 통해 광고 및 마케팅 자산의 마케팅 프로세스를 강화하고 개발을 가속화해 새로운 창의적 가능성을 개척할 수 있다.

프롬프트: 꽃무늬 미디 드레스(midi dress)를 입은 여성
프롬프트: 꽃무늬 미디 드레스(midi dress)를 입은 여성

엔터프라이즈 수준의 안전성과 보안

구글 클라우드는 신뢰할 수 있고 안전하며 책임감 있는 AI를 설계하고 개발하는 것을 최우선으로 한다. 이러한 구글 클라우드의 AI 원칙에 따라 버텍스 AI의 비오와 이마젠 3는 안전성을 핵심 근간으로 개발됐다.

  • 디지털 워터마킹(Digital watermarking): 구글 딥마인드의 신스ID(SynthID)는 이마젠 3와 비오가 생성하는 모든 이미지와 프레임에 보이지 않는 워터마크를 삽입해 잘못된 정보나 출처가 표시되는 상황을 미연에 방지한다.
  • 안전 필터(Safety filters): 비오와 이마젠 3에는 모두 유해 콘텐츠 생성을 방지하고 구글의 책임감 있는 AI 원칙을 준수하는 안전장치가 내장돼 있다. 구글 클라우드는 모델의 안전성과 개인정보 보호를 향상하기 위해 새로운 기술 개발에 지속적으로 투자하고 있다.
  • 데이터 거버넌스(Data governance): 구글 클라우드는 자사의 데이터 거버넌스와 개인정보 관리 정책에 따라 고객 데이터를 모델 학습에 사용하지 않는다. 고객 데이터는 오직 고객이 허용한 범위에 따라 관리된다.
  • 저작권 면책(Copyright indemnity): 구글 클라우드는 업계 최초로 저작권 문제에 안심할 수 있는 생성형 AI 면책 조항을 제공하고 있다. 

다양한 글로벌 기업 고객이 버텍스 AI에서 비오와 이마젠을 활용해 가치를 창출하고 있다. 글로벌 마케팅 및 커뮤니케이션 서비스 그룹 WPP는 자사의 마케팅 혁신을 위한 AI 기반 운영 체제인 ‘WPP 오픈(WPP Open)’의 이미지 생성에 이마젠 3를 활용하고 있다. 곧 WPP는 동영상 생성 과정에도 비오를 통합하여 콘텐츠의 아이디어 구상 및 제작 과정을 간소화할 예정이다. 이러한 도입 확장을 통해 WPP는 더 높은 수준의 창의성과 효율성을 실현할 수 있게 됐다.

글로벌 디지털 여행 플랫폼 아고다(Agoda)는 버텍스 AI에서 이마젠과 비오를 시각 콘텐츠 제작을 위해 테스트하고 있다. 여행지의 고유한 이미지를 생성하고 이를 동영상 제작에 활용한다. 아고다는 비오와 이마젠을 사용해홍보 동영상을 제작했으며, 이를 통해 제작 시간을 크게 단축했다.

글로벌 스마트 기기 공급업체인 아너(Honor)는 현재 수백만 대의 스마트폰에 이마젠을 탑재하여 사용자가 직접 AI 이미지 생성 기능을 사용할 수 있도록 제공하고 있다. 이를 통해 사용자는 아웃페인팅(outpainting) 및 스타일(stylization) 같은 기능을 사용해 손쉽게 사진을 편집하고 수정할 수 있다.

저작권자 © 매드클럽 무단전재 및 재배포 금지
관련기사