一键增删物体,AI让视频编辑不再“烧脑”
还在为视频里多出的路人甲而头疼?想给镜头加一辆飞驰的校车却苦于不会用专业软件?现在,这些问题可能只需要一句话就能解决。
谷歌 DeepMind 最新推出了其 AI 视频生成模型 Veo 的重大升级——“精确编辑”(Precision Editing)功能,正式将 AI 视频编辑从“生成即完成”带入“边生成边精修”的新时代。简单来说:你只要打几个字,就能在已有视频中添加或删除任何元素——无论是人物、车辆,还是背景中的树木、招牌,AI 都能智能补全画面,不留痕迹。
文字即剪辑:让好莱坞级修改变得人人可及
想象这样一个场景:你正在制作一段城市街景视频,但画面中有个行人挡住了理想构图。过去你可能需要逐帧蒙版、手动修复背景,耗时又费力。而现在,只需输入“移除路边的行人”,Veo 就会自动识别并删除目标对象,同时根据周围环境智能重建被遮挡的地面、光影和纹理,连阴影和透视都保持一致。
同样地,如果你希望“添加一辆黄色校车从左向右驶过”,系统不仅会生成符合场景比例的车辆,还会精准匹配当前镜头的光照方向、运动轨迹和相机角度,确保新车驶过时毫无违和感。
这项功能的核心,是 Veo 背后强大的生成式 AI 对物理规律、空间逻辑和视觉连续性的深度理解。它不再只是“画出来”,而是真正“想清楚了再画”。
Veo 3.1 全面进化:不只是编辑,更是创作加速器
此次“精确编辑”是 Veo 3.1 版本升级的核心亮点,专为谷歌自家的 AI 影视创作平台 Flow 打造。除了编辑能力,新版本还带来了多项关键提升:
- 原生支持 1080p 高清输出,画质更清晰
- 视频长度最长可达 1 分钟,满足更多叙事需求
- 新增多提示词场景生成与音频同步优化,音画更协调
- 在角色一致性与叙事控制上,比前代提升超 30%
- 编辑准确率高达 95%,在基准测试中显著领先 OpenAI 的 Sora 2 等竞品
更酷的是,用户可以在 Flow 中上传“成分”——比如预设的角色形象、风格参考图或动作模板——然后通过精确编辑不断扩展镜头,从单帧画面一键生成完整故事板。这对广告、营销、企业培训等内容创作者而言,意味着制作周期可能从几天缩短到几小时。
从实验到落地:AI 视频正迈向“生产级”
谷歌 DeepMind 强调,精确编辑功能的推出,标志着 AI 视频技术正从“炫技演示”走向“实际可用”。此前,Veo 已在图像生成模型 Imagen 3 和语音模型 Chirp 3 中展现出强大的“inpainting”(内容填充)能力,而此次视频级的实现,则是真正迈向生产就绪(production-ready) 的关键一步。
目前,该功能已作为实验性工具集成进 Flow 平台,Google AI Pro 和 Ultra 订阅用户可优先体验。开发者也可通过 Vertex AI 平台 接入企业级能力,例如定制语音合成、优化物体移除算法等,为品牌内容、教育视频等场景提供自动化解决方案。
创作民主化:下一个“剪映”可能是AI
“精确编辑让 AI 视频创作真正民主化,用户无需专业技能即可实现好莱坞级别的修改。” ——这是 DeepMind 在官方博客中的豪言,但如今看来,这已不再是夸张。
随着短视频、社交媒体和数字营销的爆发式增长,创作者对高效、灵活、低成本工具的需求前所未有。Veo 的这次升级,或许正是那个“临界点”——让每个人都能像打字一样编辑视频,把创意的边界彻底打开。
未来,我们或许不再需要复杂的剪辑软件,只需要一个想法,一段文字,一部属于自己的“电影”就能自动上演。