图像生成视频 AI — 让任意照片动起来

上传一张照片，描述动作，Gemini Veo 3.1 就能把它变成带同步声音的 1080p 片段。
参考帧锁定角色一致性。物理感知运动可原生处理布料、水、头发和折射。

上传图像

查看价格

支持 JPG、PNG 和 WebP，最大 10 MB。输出带同步音频的 5–8 秒片段 — 每条片段 60 credits。

用图像生成视频 AI 你能做什么

Veo 3.1 不只是给你的照片做平移和缩放。它会生成尊重画面中物体物理规律的全新运动。

01.

参考帧锁定

上传 1 到 4 张同一主体的图像。Veo 3.1 会在每一帧生成中保持角色一致 — 同一张脸、同一套衣服、同一处光线。

02.

物理感知运动

布料折叠正确，水面有反射，头发随惯性摆动。透过玻璃和水的折射原生处理 — 没有抖动的扩散伪影。

03.

内置同步音频

Veo 3.1 在生成画面的同一次模型处理中生成环境声、脚步声和音乐提示 — 所以你描述的运动一出来就已经配好了声。随时可关闭音频导出无声 MP4。

为什么 GeminiOmni 图像生成视频胜过同类产品

摄影师、营销人员和独立创始人选择我们的三个理由。

Veo 3.1 配合参考帧能在 8 秒片段中输出一致的角色 — 这正是 Runway Gen-3 和 Kling 在处理人物主体时仍然吃力的地方。

图像生成视频 AI — 常见问题

还有其他问题？发邮件至 [email protected]。

01.

这个 AI 接受哪些图像格式？

JPG、PNG 和 WebP，最大 10 MB。我们建议至少 1024x1024 以获得最佳效果 — Veo 3.1 会放大较小的输入，但细节可能下降。

02.

每段动画多少钱？

每条片段从同一个共享余额扣 60 credits。你可以买一次性套餐（$9 Starter = 1,000 credits），也可以订阅 — Creator 是 $14/mo 按年计费，每月 800 credits。订阅的 credits 永不过期，失败的生成会自动退款。

03.

参考帧是怎么工作的？

上传 1 到 4 张同一主体的图像 — 不同角度或表情。Veo 3.1 把它们当作锚点，在整条片段中保持角色一致，而不是逐帧漂移。

04.

输出包含声音吗？

包含。Veo 3.1 在一次模型处理中同时生成画面与空间音频，所以环境声、脚步声和音乐提示都与画面运动相匹配。你也可以关闭音频，导出无声 MP4。

05.

图像生成视频工具带水印吗？

只有 $9 Starter 套餐在右下角带一个小水印，并授权用于个人用途。所有订阅以及 Power 和 Pro credit 套餐都会去除水印，并为每条片段授予永久商业授权。

让你的第一张照片动起来。

上传一张图像，描述动作，两分钟内拿到片段。

试试图像生成视频

改用文本生成视频