就在刚刚,Google Deepmind 推出了新的视频模型 Veo 2 和 Imagen 3。
Google CEO Sundar Pichai 第一时间在 X 平台发文介绍了这两款产品:
我们非常荣幸推出 Veo 2,这款全新、最先进的视频模型(具备更强的真实世界物理与运动理解,支持最高 4K 分辨率)。
你可以在 VideoFX 上加入等候名单。
我们改进后的 Imagen 3 模型同样达到了行业领先的成果,并将于今天在 100 多个国家推出,届时将在 ImageFX 平台上线。
根据官方介绍,Veo 2 带来了多项重要突破:
支持制作高达 4K 分辨率的视频
能够识别指令中的摄像机控制,例如广角、第一人称视角和无人机拍摄
能更真实地模拟物理现象和人类表情变化
相比其他视频模型常见的「错误生成」问题(如多余手指或意外物体),Veo 2 显著降低了这类错误的出现频率,大幅提升了输出结果的真实度。
在安全性方面,所有由 Veo 2 生成的视频都会嵌入不可见的 SynthID 水印,便于识别其 AI 生成的属性。
Google Labs 的视频生成工具 VideoFX 已集成了 Veo 2 的新功能,同时扩大了用户访问范围。