Veo 2

https://deepmind.google/technologies/veo/veo-2/

Veo 2

Veo is our state-of-the-art video generation model. It creates high quality video clips that match the style and content of a user's prompts, in resolutions up to 4K resolution.

deepmind.google

최첨단 비디오 생성 모델

Veo는 현실감 있는 동작과 높은 품질의 비디오를 생성하며, 최대 4K 해상도를 지원합니다. 다양한 스타일을 탐구하고, 확장된 카메라 제어 기능을 통해 나만의 스타일을 찾아보세요.

품질과 제어의 재정의

Veo 2는 단순한 지시부터 복잡한 지시까지 충실히 따를 수 있으며, 현실 세계의 물리학을 설득력 있게 시뮬레이션하고 폭넓은 시각적 스타일을 제공합니다.

향상된 사실감과 정밀도

다른 AI 비디오 모델에 비해 디테일, 사실감, 아티팩트 감소 측면에서 크게 개선되었습니다.

고급 모션 처리 기능

Veo는 물리학에 대한 이해와 상세한 지시를 따르는 능력을 바탕으로 높은 정확도로 모션을 표현합니다.

더욱 향상된 카메라 제어 옵션

지시를 정밀하게 해석하여 다양한 촬영 스타일, 각도, 움직임, 그리고 이들의 조합을 생성할 수 있습니다.

https://www.youtube.com/watch?v=gztv6XYUzTM

Prompt: This medium shot, with a shallow depth of field, portrays a cute cartoon girl with wavy brown hair, sitting upright in a 1980s kitchen. Her hair is medium length and wavy. She has a small, slightly upturned nose, and small, rounded ears. She is very animated and excited as she talks to the camera.

https://www.youtube.com/watch?v=e-uf510bXH0

Prompt: The sun rises slowly behind a perfectly plated breakfast scene. Thick, golden maple syrup pours in slow motion over a stack of fluffy pancakes, each one releasing a soft, warm steam cloud. A close-up of crispy bacon sizzles, sending tiny embers of golden grease into the air. Coffee pours in smooth, swirling motion into a crystal-clear cup, filling it with deep brown layers of crema. Scene ends with a camera swoop into a fresh-cut orange, revealing its bright, juicy segments in stunning macro detail.

https://www.youtube.com/watch?v=oMZ7YNaSfn8

Prompt: The camera floats gently through rows of pastel-painted wooden beehives, buzzing honeybees gliding in and out of frame. The motion settles on the refined farmer standing at the center, his pristine white beekeeping suit gleaming in the golden afternoon light. He lifts a jar of honey, tilting it slightly to catch the light. Behind him, tall sunflowers sway rhythmically in the breeze, their petals glowing in the warm sunlight. The camera tilts upward to reveal a retro farmhouse with mint-green shutters, its walls dappled with shadows from swaying trees. Shot with a 35mm lens on Kodak Portra 400 film, the golden light creates rich textures on the farmer’s gloves, marmalade jar, and weathered wood of the beehives.

Veo 2는 다른 선도적인 비디오 생성 모델을 능가합니다

이는 인간 평가자가 성능을 기준으로 평가한 결과입니다.

벤치마크

Veo는 최상위 비디오 생성 모델과의 비교에서, 인간 평가자들이 직접 평가한 결과 최첨단 성능을 기록했습니다.

참여자들은 Meta에서 공개한 벤치마크 데이터셋인 MovieGenBench에서 1003개의 프롬프트와 해당 비디오를 시청했습니다.
Veo 2는 전반적인 선호도와 프롬프트를 정확히 따르는 능력에서 최고 성과를 보였습니다.

모든 비교는 720p 해상도에서 이루어졌습니다.
Veo 샘플의 길이는 8초, VideoGen 샘플은 10초, 기타 모델 샘플은 5초입니다. 평가자들에게는 각 샘플의 전체 길이를 제공했습니다.

Veo: 고품질 비디오 생성의 큰 도약

Veo는 고품질 비디오 생성에서 중요한 진전을 이루었습니다.

한계

Veo 2는 놀라운 발전을 보여주었지만, 현실감 있고 역동적이며 복잡한 비디오를 생성하거나, 복잡한 장면 또는 동작에서 완벽한 일관성을 유지하는 데는 여전히 도전 과제가 남아 있습니다.
이러한 영역에서 성능을 지속적으로 개발하고 개선해 나갈 것입니다.

이 페이지의 모든 비디오는 Veo로 생성되었으며 수정되지 않았습니다.

감사의 말

Veo 2는 다음 연구자 및 엔지니어들의 중요한 기여로 가능해졌습니다:
Agrim Gupta, Ali Razavi, Ankush Gupta, Dumitru Erhan, Eric Lau, Frank Belletti, Gabe Barth-Maron, Hakan Erdogan, Hakim Sidahmed, Henna Nandwani, Hernan Moraldo, Hyunjik Kim, Jeff Donahue, José Lezama, Kurtis David, Marc van Zee, Medhini Narasimhan, Miaosen Wang, Mohammad Babaeizadeh, Nelly Papalampidi, Nick Pezzotti, Nilpa Jha, Parker Barnes, Pieter-Jan Kindermans, Rachel Hornung, Ruben Villegas, Ryan Poplin, Salah Zaiem, Sander Dieleman, Sayna Ebrahimi, Scott Wisdom, Serena Zhang, Shlomi Fruchter, Weizhe Hua, Xinchen Yan, Yuqing Du, Yutian Chen.

모든 클립은 Veo를 통해 직접 생성되었으며, Eleni Shaw, Signe Nørly, Andeep Toor, Gregory Shaw, Matthieu Kim Lorrain, Kory Mathewson, Irina Blok이 참여했습니다.

또한, 프로젝트의 핵심 요소를 개발하고 개선하는 데 소중한 파트너십을 제공한 다음 분들께 감사드립니다:
Abhishek Sharma, Adams Yu, Ahmed Chowdhury, Aida Nematzadeh, Andrew Audibert, Andrew Pierson, Ariel Ephrat, Ashley Feden, Austin Tarango, Austin Waters, Bryan Seybold, Daniel Tanis, David Reid, Dirk Robinson, Evgeny Gladchenko, Frank Perbet, Frankie Garcia, Hadi Hashemi, Hongliang Fei, Huisheng Wang, Inbar Mosseri, Jakob Bauer, Jenny Brennan, Joana Iljazi, John Zhang, Jonas Adler, Josh Newlan, Junyoung Chung, Kan Chen, Karol Langner, Katie Zhang, Lasse Espeholt, Luis C. Cobo, Mahyar Bordbar, Mohammad Taghi Saffar, Mukul Bhutani, Nikhil Khadke, Norman Casagrande, Oliver Wang, Oliver Woodman, Omer Tov, Orly Liba, Pankil Botadra, Petko Georgiev, Piyush Kumar, RJ Mical, Seliem El-Sayed, Shixin Luo, Simon Wang, Srinivas Tadepalli, Thomas Kipf, Tobias Pfaff, Tom Eccles, Tom Hume, Vikas Verma, Will Hawkins, Xinyu Wang, Yelin Kim, Yilin Gao, Yori Zwols, Yuchi Liu, Yukun Zhu, Zarana Parekh, Zhenkai Zhu, Zu Kim.

특히, 연구 과정 동안 통찰력 있는 지도와 지원을 제공해 주신 Douglas Eck, Aäron van den Oord, Eli Collins, Koray Kavukcuoglu, Demis Hassabis께 깊은 감사를 드립니다.

구글 딥마인드 및 구글의 파트너로서 기여해 주신 모든 분들께도 감사의 말씀을 전합니다.

'소식' 카테고리의 다른 글

니혼코츠(Nihon Kotsu)와 GO와 함께하는 첫 번째 국제 로드 트립 (waymo 국제 진출) (2)	2024.12.18
Imagen 3 (1)	2024.12.18
엘론 머스크는 OpenAI의 영리화를 원했다 (1)	2024.12.18
Making quantum error correction work (3)	2024.12.11
Meet Willow, our state-of-the-art quantum chip (2)	2024.12.11

JunHan's AI Factory

Veo 2

품질과 제어의 재정의

향상된 사실감과 정밀도

고급 모션 처리 기능

더욱 향상된 카메라 제어 옵션

벤치마크

Veo: 고품질 비디오 생성의 큰 도약

한계

감사의 말

'소식' 카테고리의 다른 글

티스토리툴바

Veo 2

품질과 제어의 재정의

향상된 사실감과 정밀도

고급 모션 처리 기능

더욱 향상된 카메라 제어 옵션

벤치마크

Veo: 고품질 비디오 생성의 큰 도약

한계

감사의 말

'소식' 카테고리의 다른 글

'소식' Related Articles

티스토리툴바