谷歌I/O AI放大招（下篇）：这7个新功能，你准备好迎接了吗？

如果你觉得之前已经被AI的快速发展震撼到，那么谷歌最近的I/O大会简直就是一场“核弹级”的发布会！这家科技巨头在AI领域的新品、新模式、新升级简直多到爆炸，特别是围绕其Gemini模型的一系列更新，让人眼花缭乱。

上次我们聊了谷歌I/O大会AI更新的前8个亮点，如果你错过了，赶紧去补补课。今天，我们要继续深挖，看看剩下那7个更让人惊掉下巴的功能，以及它们将如何助力你的业务增长。

说实话，一年半前，谷歌在AI领域可能还在奋力争取一席之地，甚至不一定能稳坐前三。但现在，尤其是在这次I/O大会之后，他们无疑已经独自站在了AI之巅，让其他所有竞争者都得奋起直追了。我原本只计划用一篇内容来覆盖谷歌I/O的所有AI发布，就像我之前报道微软Build大会那样。但谷歌这次实在是太“疯狂”了，内容多到不得不分成两篇来讲。

好了，废话不多说，咖啡备好，我们直接进入今天的主题——谷歌I/O最重磅的7大AI更新！

快速回顾：上次我们聊了啥？

在我们深入探讨今天的“王炸”功能之前，先简单回顾一下上次提到的8个亮点（排名从15到8）：

Imagine 4：谷歌全新的AI图像生成器。
Chrome集成Gemini：即将推出的新功能。
个性化邮件：天啊，谷歌快点推出这个功能吧，我太需要了！
Notebook LM更新：可自定义长度，视频功能也即将上线。
Gemini Diffusion：一种新型大语言模型。
Google Meet实时翻译：目前仅限付费用户和英语西班牙语，但很快会支持更多语言。
Gemini应用更新：内容太多，未来几周我们可能会专门出几期节目来聊。
Gemma 3N：谷歌新的开源小语言模型，40亿参数，性能直逼某些大厂的旗舰模型。

好了，热身完毕，让我们直接进入今天最激动人心的部分！

谷歌I/O七大AI“黑科技”深度解析

第七名：Flow —— AI电影制作新工具

如果这玩意儿真的能像演示的那样流畅运行，我敢说，这就是短视频的未来，没有之一！ 我可不是轻易下这种结论的。作为一个在摄影和视频制作领域摸爬滚打过半辈子的人，我对视觉效果还是有点发言权的。

Flow 这款工具，简单来说，就是把谷歌最顶尖的创意工具整合到了一起。它融合了最新的视频生成器 Veo 3、最新的AI图像生成器 Imagine 4，以及强大的Gemini提示功能。最关键的是，它解决了AI视频生成中长期存在的“场景一致性”难题。以前的工具生成的几秒钟短片可能很惊艳，但想把它们拼接成一个连贯的故事，角色还能保持一致？太难了！

Flow的出现，让这一切从“派对小花招”变成了实实在在的“商业生产力工具”。目前，Flow主要面向付费用户，每月20美元的Google AI Pro计划（以前叫Gemini Advance）用户每月有100次生成额度，而更高级的Ultra计划（我们后面会提到）用户则可能有更多（甚至无限）的使用权。

它能让你通过自然语言提示生成场景、控制镜头运动、编辑和扩展镜头、搭建故事板，甚至还有一个Flow TV内容库。虽然目前生成的片段长度限制在8秒，但你可以将它们无缝衔接起来，还带有环境音效和Veo 3的音频生成功能。可以预见，从创作者、个体创业者到大型企业，都会发现它的巨大潜力。

第六名：Veo 3 —— 效果炸裂的AI视频工具与V2更新

Veo 3，这玩意儿最近在社交媒体上简直是刷屏级的存在！它是谷歌最新的顶级视频生成模型，比V2有了显著提升。最牛的地方在于它原生支持音频生成，包括环境音和角色对话！ 想象一下，一个场景里有多个角色，AI能自动配上对话和背景音，这简直不可思议。

老实说，我看到Veo 3的演示片段时，下巴都快掉下来了。一个女歌剧演员在管弦乐队的伴奏下演唱，背景里的小提琴手，他们的动作和音乐居然能对得上！另一个片段里，一个女人在小型演唱会现场表演，鼓手的节奏、观众的氛围、歌手的口型，真实到令人发指。

目前，Veo 3主要提供给美国的Ultra订阅用户。但它的出现，真的让我开始思考：未来我们消费的视频内容，有多少会是AI生成的？我甚至大胆预测，在不久的将来（可能不是未来两年，但也许是2020年代末），我们观看的大部分内容，包括电视节目，都可能是AI制作的。

当然，这种技术的潜力也伴随着风险，比如虚假信息的传播。谷歌也在努力通过SynthID等技术来为AI生成内容打上“隐形水印”，但道高一尺魔高一丈，这方面的挑战依然巨大。

第五名：AI模式在谷歌搜索中的应用

这其实不算一个全新的东西，但它得到了极大的改进，并且部分功能也向免费用户开放了。简单来说，就是在谷歌搜索中增加了一个专门的AI驱动标签页（网页版和App都有），用来处理复杂查询并提供AI生成的答案。

新升级的功能包括生成自定义图表和图形，更自然地处理后续追问，以及一些新的购物功能，比如用个人照片进行虚拟试穿！是的，你没听错，你可以上传自己的照片，看看衣服上身效果怎么样。还有AI辅助结账功能，看来我的钱包要不保了。

在我看来，AI模式是谷歌在AI搜索领域的一种“对冲”策略。它既想通过AI概览来改进传统搜索，又想提供一个更纯粹的AI问答引擎，介于传统搜索和Gemini之间的体验。这个模式现在也由最新的Gemini 2.5模型驱动，还加入了深度搜索功能。

第四名：Gemini Live（结合Project Astra）

这是一款增强版的实时助手，可以通过设备的摄像头理解并与你周围的环境互动。安卓用户已经可以用上，iOS的部分功能也已上线，更多功能本周会陆续推出。

想象一下，你的手机助手能看、能听、能理解你看到的一切，还能帮你操作。你可以共享屏幕，用自然语音跟它交流。它甚至可以帮你打开YouTube搜索视频，从你的邮件里提取信息，识别墙上零件并根据手册找到正确的型号，帮你给自行车店打电话确认零件库存并下单，还能在你和别人聊天被打断后，继续刚才的话题！

这其中很多强大的功能，尤其是那些需要AI主动为你执行任务（比如打电话、控制应用界面）的能力，都得益于Project Astra技术的集成。这部分高级功能目前主要面向每月250美元的Ultra计划用户。但即便是免费版，其看图识物、实时识别等功能也已经非常强大。我们后面肯定会专门做一期节目来详细体验这个。

第三名：Gemini 2.5系列模型更新

是的，你没看错，世界上最强大的模型变得更强了！

特别值得一提的是Gemini 2.5 Flash，这个之前被认为是“轻量版”的模型，现在竟然是全球第二强的模型，仅次于它的大哥Gemini 2.5 Pro！这在以前是不可想象的，通常“轻量版”能排进前七八名就不错了。Gemini 2.5 Pro稳坐第一我们不意外，但Flash能有如此表现，简直是史无前例！

此外，Gemini 2.5 Pro也将迎来一个“深度思考模式”（Deep Think Mode），专供Ultra订阅用户。顾名思义，就是让AI花更多时间进行更复杂的推理和问题解决。虽然我个人不太喜欢新的“思考摘要”功能，更怀念之前那种更原始的“思维链”展示，但模型的整体能力提升是毋庸置疑的。

这些模型的进步意味着什么？很简单，无论你用的是哪个AI平台，都应该把它们作为你日常工作的起点，因为它们正变得越来越强大，未来也只会和我们的工作生活结合得越来越紧密。

第二名：谷歌AI Ultra订阅 —— 超级贵，也超级强

这是个大新闻，而且不全是好消息。我一直很欣赏生成式AI运动带来的技术民主化，大部分人花20美元就能用上世界顶尖的技术。但现在，谷歌也开始效仿OpenAI，推出了每月高达250美元的“奢侈品级”AI套餐。

好处是，你确实能获得令人惊叹的技术，对于企业来说，这个价格或许还能接受。但对于个人用户，除非你是小企业主或者对技术有极致追求，否则这个价格确实有点高。

更大的槽点在于，目前这个Ultra计划只对个人Gmail邮箱开放，企业版Workspace账户用不了！ 谷歌，认真的吗？我希望能尽快在工作账户上用上这些强大的功能，比如个性化邮件、Gemini Live的上下文理解能力，如果只能在个人邮箱里用，那对我工作的帮助就大打折扣了。我当然理解企业级服务可能有更多技术和安全上的考量，但还是希望谷歌能尽快解决这个问题。

Ultra订阅包含了什么呢？Deep Research的最高使用权限、Veo 3的抢先体验权、Flow和Project Mariner（我们马上会讲到）的使用权、带“深度思考”的Gemini 2.5 Pro、YouTube Premium会员、30TB存储空间等等。前三个月优惠价125美元，之后恢复250美元/月。

第一名：Project Mariner（或称Agent Mode）—— 终极AI助理

这绝对是本次谷歌I/O大会上最重磅的发布！

简单来说，Project Mariner是一个能够自主完成在线任务的AI代理。 你可以把它想象成OpenAI的Operator，但它能接入你的数据。我已经试用了一下，目前感觉速度稍慢，但能力非常强大。

它最酷的地方在于：

可以同时处理多达10个任务，每个任务都在一个独立的“沙盒”中运行。
可以控制Chrome浏览器：移动光标、点击按钮、填写表单。
拥有“教学与重复”模式：这太牛了！你可以让它记录你的屏幕和语音操作，教会它执行一个复杂的、重复性的流程。比如，你每天都要查邮件、做研究、整理文档，理论上你可以教会Mariner来帮你做。

当然，目前这个“神兽”也只对美国的Ultra订阅用户开放，并且不能在Workspace账户上使用，这真是个巨大的遗憾。谷歌计划在今年夏天进行更广泛的推广。

想象一下，能够将那些重复、单调的日常任务自动化，跨多个平台操作，这对于提升效率的潜力是无限的！而且它仍然由Gemini 2.5驱动，具备强大的语言理解、思考和策略制定能力。我甚至想测试一下，Mariner能不能自己去调用其他的AI工具，比如让它自己去用Gemini或者其他AI产品来完成任务，这简直是“套娃”了！

呼，一口气讲了这么多，信息量确实有点大！从AI电影制作到能帮你干活的AI代理，谷歌这次真的是把压箱底的好东西都拿出来了。

这些新功能中，你对哪个最感兴趣，或者觉得哪个最有可能改变你的工作方式呢？

谷歌I/O AI放大招（下篇）：这7个新功能，你准备好迎接了吗？

零代码造应用？Firebase Studio太神了！

数字人、会说话的狗和AI特效：Edimakor想让你成为下一个爆款视频博主

救命！AI都快成精了，我们怎么还这么忙？

生产力坐火箭，幸福感原地杵？普通人如何能“卷得赢”AI

AI主题ETF份额激增

AI算力，你还觉得它高不可攀？悄悄告诉你，游戏规则正在被改写！

类似文章