Omni Mode 将随 Google I/O · 5 月 20 日上线

一个工作室,接住 Gemini 的每一种模态。

用 Nano Banana 2 编辑图像。用 Veo 3.1 生成短片 —— 画面和原生空间音频一次推理出,跨场景角色一致。和 Gemini 实时对话。把 1500 页的 PDF 丢进去,直接问问题。
一个安静、克制、不卖积分的工作室——不需要 GCP 账号,不玩加价戏法。

TOOL
AI Video Generator
CinematicGolden hourAmbient jazz
0 / 4000
RESOLUTION
ASPECT RATIO
DURATION
SPEED
AUDIO
≈ 50 credits·~30s generation·

由前 Hugging Face 工程师在柏林独立开发。按次付费,服务端代理,每个工具都标注底层 Gemini 模型。

GeminiOmni 是什么?

一个独立、有主张的 Google Gemini 工具前端。四个聚焦的工具,每个都钉在能跑通任务的最便宜模型上——再加一个为 Gemini Omni 本体准备的候机厅。

全模态,但不吹嘘

Gemini 本身就覆盖图像、视频、音频和 100 万 token 文本。我们把这些模态干净地端出来,而不是给它们套一层假壳。

按次付费,不玩积分游戏

每次生成都给出明码标价(精确到分)。没有「50 credits / 65 credits」的迷宫,也没有忘记取消就续费的捆绑包。

服务端代理 Key

你的请求打到我们 API,我们 API 再打到 Google。客户端没有任何 Key,杜绝 2026 年初那种「Gemini API Key 泄露 8 万美元账单」的事故。

一个人公开做,公开记账

由 Lena Hoffmann(前 Hugging Face)独立开发。构建笔记、模型选择、价差对比都在博客里——你可以审计每一欧元花到哪。

比起其他套壳,GeminiOmni 不一样在哪

Gemini 套壳赛道已经很拥挤,但大多数都是抄作业。我们的几条红线:

Banana Studio 用 Gemini 3.1 Flash Image Preview;Omni Reel 用 Veo 3.1 Fast;Live Booth 用 Gemini 3.1 Flash Live;Long Read 用 Gemini 2.5 Flash。不玩「powered by AI」的烟雾弹。

工具

今天四个。Google 一发 API,第五个当天上。

01.

Banana Studio — 对话式图像编辑

上传一张图,描述改动,得到一致性极高的结果。底层:Gemini 3.1 Flash Image Preview(Nano Banana 2)。原生 2K,可选 4K 上采样。

02.

Omni Reel — 文 / 图生视频

8 秒电影感短片,自带同步音轨。默认 Veo 3.1 Fast($0.15/秒)。预置模板:LinkedIn 自介、TikTok 开场、产品 demo。

03.

Live Booth — 与 Gemini 实时语音

60 秒免费体验 Gemini 3.1 Flash Live。无需注册。说出来,它说回来。Google 实时语音模型的第一个消费级界面。

04.

Long Read — 100 万上下文 PDF / 文档问答

丢进 1500 页 PDF,问任何问题,得到带页码引用的回答。Gemini 2.5 Flash——不切块、不搭 RAG 管道,只看答案。

05.

Omni Mode — 候补名单(5 月 20 日)

Google 预计在 5 月 20 日 I/O 发布 Gemini Omni。API 一开,我们当天接入。留下邮箱,第一时间通知你。

06.

构建笔记 — 模型选择、价差、坑点

每次工作室更新都附一篇短文:试过哪些模型、单次调用多少钱、为什么留下或换掉。少看营销话术,多看账单。

大白话 FAQ

还有问题?发邮件到 lena@geminiomni-ai.com。







选个工具,做点东西。

无需注册即可开始。只为实际生成的内容付费。

GeminiOmni — 一站玩转 Google Gemini 全模态