谷歌Veo 3.1紧急上线硬刚Sora 2:实测之后,差距依然明显?
twitters
10-17
161

2025 年,AI 视频生成的浪潮正以前所未有的速度席卷创意行业。10 月 16 日凌晨,谷歌毫无预兆地把 Veo 3.1 丢进 Google Flow 实验室,官方口径只有一句“ faster, more controllable, and ready for creators”。但所有人都知道,这是对 OpenAI Sora 2 三天前“无限量免费”杀招的紧急回应。

入口即刻开放:labs.google/fx/zh/tools/flow

一、Veo 3.1:从「视频生成模型」进化为「AI 导演助手」

早期的视频生成模型往往专注于“生成一段视频”,而 Veo 3.1 则更像一个拥有摄影语言、叙事逻辑与声音感知的 AI 影视创作工具

与前代版本相比,Veo 3.1 带来了以下关键升级:

能力新特性说明
🎥 多镜头理解与构图控制支持更复杂的场景切换与镜头语言,能理解如 “close-up shot”、“crane movement” 等电影术语。
🗣️ 音频与对白生成生成的角色对话能与口型同步,且可加入环境声、音效、背景音乐。
🖼️ 图像到视频(Image-to-Video)通过参考图像创建连贯的动画片段,保证风格统一。
🎞️ 首尾帧动画(First & Last Frame)从指定的起始与结束画面生成自然的过渡动画。
🧩 可控对象编辑支持在视频中添加或删除物体(目前音频部分仍有限制)。
🪶 SynthID 水印所有视频均自动嵌入 AI 来源识别水印,确保内容可追溯性。

可以说,Veo 不再只是一个“生成视频的模型”,而更像一个能够“理解分镜与节奏”的 AI 摄影师。


二、提示语框架:让 AI 听懂你的「导演语言」

部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章

未来的创作门槛,不在于设备,而在于 “如何对 AI 说话”。 正如这份指南揭示的真相:

“Every great video starts with a great prompt.”

Sora 2 像 天赋型选手,镜头感、审美、节奏全是“天生”的; Veo 3.1 则是 技术型学霸,把“控制”拆成无数旋钮摆在你面前。 一个让你爽,一个让你改。 短期看,Sora 2 依旧会是流量宠儿;长期看,当“可控”成为商业刚需,谷歌的付费墙未必拦得住真正的生产者。

下一次升级,OpenAI 只要补齐“编辑”短板,Veo 3.1 就可能沦为昂贵的过渡品。 但在今天,如果你想让同一张脸在 64 秒里不换演员、不穿帮、还能加龙加剑加爆炸,整个地球上只有 Veo 3.1 能立刻给你 exporting。



微信扫描下方的二维码阅读更多精彩内容

打赏
当AI开始“发现”癌症治疗新途径:Google Gemma 模型的重大突破
上一篇
把"深度思考"做成四档旋钮——豆包 1.6 系列新品全景拆解
下一篇
生成中...
点赞是美意,赞赏是鼓励