구글 Veo 3, 새로운 기준 설정: AI 모델이 통합된 사운드로 비디오 생성

Google Veo 3

최근 I/O 개발자 행사에서 구글은 디지털 콘텐츠를 생성하고 소비하는 방식을 완전히 변화시킬 수 있는 다양한 AI 도구를 공개했습니다.

선두주자는 구글 Veo 3로, 사운드, 물리학 및 자연스러운 움직임을 AI 생성 콘텐츠에 통합한 비디오 생성 모델입니다.

구글 Veo 3, 사운드와 사실감으로 AI 비디오 제작 재정의

구글 Veo 3는 일반적인 인공지능 모델이 아닙니다. 새가 지저귀거나 도시의 교통 소음과 같은 동기화된 오디오로 비디오를 생성할 수 있어 각 프레임에 생명을 더합니다. 또한, 물리학의 법칙을 이해하기 때문에 움직임과 상호작용이 자연스럽게 나타납니다.

립싱크는 또 다른 강점입니다. 배경 소음이나 음성 해설이 있는 장면을 녹화하든, Veo 3는 완벽한 타이밍을 유지합니다.

이는 콘텐츠 제작자, 교육자 및 영화 제작자에게 현실적인 비디오 경험을 더 적은 노력으로 만들 수 있는 큰 진전을 의미합니다.

미국에서는 Veo 3가 현재 Gemini Ultra 구독자와 비즈니스 사용자를 위한 Vertex AI를 통해 Gemini 앱에서 이용 가능합니다. 또한 구글의 새로운 AI 영화 제작 플랫폼인 Flow를 지원합니다.

Google Veo 3

구글의 Flow는 Veo 3, Imagen 및 Gemini의 상위 세 가지 AI 모델을 통합합니다. 이러한 도구의 도움으로 Flow는 장면에 대한 설명을 기반으로 비디오를 생성합니다.

창의적인 비전을 이해하는 지능형 비서처럼 느껴져야 합니다. 미국의 AI Pro 및 Ultra 사용자는 이제 Flow에 접근할 수 있습니다. 그러나 구글은 곧 전 세계적으로 출시할 계획입니다.

Veo 3가 하이라이트이지만, Veo 2는 여전히 Flow에서 사용됩니다. 객체, 얼굴 또는 스타일의 참조 이미지에 맞는 비디오를 생성할 수 있습니다. 또한 사용자가 장면을 회전하거나 확대 및 축소할 수 있는 카메라 제어 기능도 있습니다.

또 다른 중요한 발견은 고품질 이미지를 생성하기 위해 만들어진 모델인 Imagen 4입니다. Imagen 3보다 10배 빠르게 이미지를 생성하기 때문에 세밀한 질감, 털 가닥 및 우수한 타이포그래피를 표현할 수 있습니다.

Imagen 4는 사실적인 이미지와 예술적인 이미지 모두에서 잘 작동하며 현재 Docs, Slides, Gemini 앱 및 Vertex AI의 일부입니다.

구글은 사용자가 인공지능으로 생성된 콘텐츠를 식별할 수 있도록 SynthID Detector를 출시했습니다. 구글의 AI 도구는 사용자가 업로드한 파일에서 독특한 워터마크를 검색합니다.

모든 AI 생성기가 이를 사용하는 것은 아니지만, 이 도구는 사용자가 구글의 시스템으로 생성된 콘텐츠를 식별하는 데 도움을 줍니다.

구글 Veo 3는 AI 기반 미디어의 큰 혁신입니다. 사운드, 정확한 이미지 및 정교한 편집 도구를 결합함으로써 제작자들이 그 어느 때보다 빠르게 고품질 콘텐츠를 생성할 수 있게 합니다.

특히 Flow 및 Imagen 4와 결합할 때 Veo 3는 기술이 창의성을 더 유동적이고, 구체적이며, 접근 가능하게 만드는 이야기의 미래를 흥미롭게 엿볼 수 있게 합니다.