Google I/O三大AI新品实战:Gemini 3.5 Flash、Omni与Antigravity 2.0深度评测
Google在2024年I/O大会上发布了逾百项以AI为核心的更新,但多数功能尚未全面开放,且分散在不同订阅层级与账户类型中。本文聚焦三款已上线、且对企业运营最具落地价值的产品——Gemini 3.5 Flash、Omni Flash多模态模型与Antigravity 2.0桌面应用。通过上手实测,我们梳理了它们各自的优势、陷阱,以及企业在落地时需要注意的关键问题。
一、Gemini 3.5 Flash:性能与成本的博弈
极速与强性能,但代价高昂
Gemini 3.5 Flash是Google目前综合性能最强的模型,其核心优势在于极致的响应速度:处理与返回结果的效率均超越历代Gemini模型。在并排基准测试中,它在几乎所有类别上均击败了前代Gemini 3.1 Pro,尤其在智能体编码(agentic coding)和长时运行智能体任务中表现突出。
然而,”Flash”一词的含义已发生关键转变:它曾代表极速与低价,如今虽然依旧快速,却不再廉价。对于重度依赖API的企业而言,其单位token成本可达旧版Flash模型的10至20倍。此外,该模型的token消耗量极高,导致单任务执行成本显著增加,这对企业计算AI部署的总拥有成本(TCO) 构成直接影响。
使用限额收紧
更关键的是,Google已改变过去近乎无限的”自助餐”式使用模式,改为设定严格的调用限额。许多专业用户在常规操作中可能迅速触及上限,这将直接影响企业的规模化部署计划,并可能打断此前习惯高上限用户的工作流。
二、Gemini Omni Flash:不止于视频生成的世界模型
真正的多模态能力
Gemini Omni Flash常被外界简单视为接替Veo系列的视频生成工具,但其核心能力是真正多模态(Multimodal)的:支持图像、视频、文本和音频的输入与输出。这意味着它不仅能实现”文生视频”,还能在统一界面内完成基于真实素材的视频编辑、动态对象与背景替换等跨媒介任务,从而大幅精简创意与技术工作流。
角色一致性与对话式编辑
相比前代视频模型,Omni在角色一致性方面进步显著——可跨场景保持人物身份、声音和视觉叙事连贯,有助于输出符合品牌调性的营销、培训或入职视频。其对话式编辑功能支持多轮快速修改,能显著缩短创意项目的交付周期。
当前局限
目前,Omni Flash单次生成限制为10秒视频片段,主要面向AI Pro和Ultra订阅用户在Gemini应用及Google AI平台开放。这一限制对营销或生产排期有直接影响,更适用于短视频或概念验证阶段。
三、Antigravity 2.0:Agentic编程的试水之作
基础功能与多模型支持
Antigravity 2.0是Google首次面向主流市场推出的Agentic编码桌面应用,兼容Mac、Linux和Windows,无需IDE即可运行。它支持基于项目的对话、任务调度,并能读写本地文件夹,可完成自动化文件管理等任务。
与部分竞品不同的是,Antigravity 2.0允许在工作流内直接切换多种AI模型——包括Claude Sonnet、Claude Opus、开源GPT OSS及最新Gemini系列。这对希望在模型部署上保持灵活性、避免被单一第三方工具绑定的企业而言是加分项。
显著的生态短板
然而,作为Google生态内的产品,它却缺乏与Gmail、Drive、Sheets、Calendar等关键Workspace工具的直接连接,这是一个反常的短板。在Agentic编码领域,竞品已提供更成熟的应用集成,这使得Antigravity在作为”中央指挥”或跨系统自动化中枢时的企业适用性存疑。
实测表现
在实测中,我们让Antigravity 2.0抓取播客系列信息并构建一个可交互、可筛选的网页应用。结果虽然成功生成了包含25条内容的数据库界面,但部分外链失效,需手动修正,且视觉设计带有明显的”AI生成粗糙感”。此外,尽管该应用宣称可编排多个并行智能体,但许多付费用户反映很快就会遇到使用或任务执行限额,难以实现真正的工作流并行化。
四、横向对比与商业落地建议
体验不统一与透明度不足
目前,不同Gemini界面和账户类型之间的体验并不统一。同一用户在个人账号与企业账号之间,可能无法获得相同的模型选择器或推理控制权限(如扩展思考模式),这为标准化AI业务流程带来了摩擦。
在思维链透明度(Chain-of-Thought Transparency)方面,Gemini 3.5 Flash仅提供部分推理过程视图,用户难以完整审计模型的思考路径,这使得审计与合规报告的完整性打了折扣。相比之下,竞品在此方面提供了更详尽、更易读的解释。
战略建议
对于计划采用Google最新AI套件的企业领导者,建议采取以下策略:
- 审慎评估TCO:在全面采用Gemini 3.5 Flash前,务必进行详细的ROI与TCO分析。对于API用户而言,直接从Gemini 3.1 Pro或旧版Flash切换将导致成本激增。
- 试点Omni Flash的创意工作流:将其用于需要跨模态内容生成和动态视频编辑的场景,但需验证输出是否符合现有品牌标准。
- 将Antigravity 2.0视为早期实验性工具:在当前集成不足、输出质量有限的情况下,它更适合小范围自动化探索,待生态成熟后再扩大应用。
- 关注后续版本:留意即将发布的Gemini 3.5 Pro,该版本有望改善当前性能与成本失衡的问题。
- 监控限额变化:密切留意不同Google账户类型的使用限额与模型权限调整,避免在业务扩展中遭遇流程中断。
Google最新的AI产品组合在速度、多模态创意和智能体自动化方面打开了新的 operational 机会,但同时也带来了即时的成本、可用性和集成挑战,需要企业采取审慎的部署策略。
