如果你觉得之前已经被AI的快速发展震撼到,那么谷歌最近的I/O大会简直就是一场“核弹级”的发布会!这家科技巨头在AI领域的新品、新模式、新升级简直多到爆炸,特别是围绕其Gemini模型的一系列更新,让人眼花缭乱。
上次我们聊了谷歌I/O大会AI更新的前8个亮点,如果你错过了,赶紧去补补课。今天,我们要继续深挖,看看剩下那7个更让人惊掉下巴的功能,以及它们将如何助力你的业务增长。
说实话,一年半前,谷歌在AI领域可能还在奋力争取一席之地,甚至不一定能稳坐前三。但现在,尤其是在这次I/O大会之后,他们无疑已经独自站在了AI之巅,让其他所有竞争者都得奋起直追了。我原本只计划用一篇内容来覆盖谷歌I/O的所有AI发布,就像我之前报道微软Build大会那样。但谷歌这次实在是太“疯狂”了,内容多到不得不分成两篇来讲。
好了,废话不多说,咖啡备好,我们直接进入今天的主题——谷歌I/O最重磅的7大AI更新!
快速回顾:上次我们聊了啥?
在我们深入探讨今天的“王炸”功能之前,先简单回顾一下上次提到的8个亮点(排名从15到8):
- Imagine 4:谷歌全新的AI图像生成器。
- Chrome集成Gemini:即将推出的新功能。
- 个性化邮件:天啊,谷歌快点推出这个功能吧,我太需要了!
- Notebook LM更新:可自定义长度,视频功能也即将上线。
- Gemini Diffusion:一种新型大语言模型。
- Google Meet实时翻译:目前仅限付费用户和英语西班牙语,但很快会支持更多语言。
- Gemini应用更新:内容太多,未来几周我们可能会专门出几期节目来聊。
- Gemma 3N:谷歌新的开源小语言模型,40亿参数,性能直逼某些大厂的旗舰模型。
好了,热身完毕,让我们直接进入今天最激动人心的部分!
谷歌I/O七大AI“黑科技”深度解析
第七名:Flow —— AI电影制作新工具
如果这玩意儿真的能像演示的那样流畅运行,我敢说,这就是短视频的未来,没有之一! 我可不是轻易下这种结论的。作为一个在摄影和视频制作领域摸爬滚打过半辈子的人,我对视觉效果还是有点发言权的。
Flow 这款工具,简单来说,就是把谷歌最顶尖的创意工具整合到了一起。它融合了最新的视频生成器 Veo 3、最新的AI图像生成器 Imagine 4,以及强大的Gemini提示功能。最关键的是,它解决了AI视频生成中长期存在的“场景一致性”难题。以前的工具生成的几秒钟短片可能很惊艳,但想把它们拼接成一个连贯的故事,角色还能保持一致?太难了!
Flow的出现,让这一切从“派对小花招”变成了实实在在的“商业生产力工具”。目前,Flow主要面向付费用户,每月20美元的Google AI Pro计划(以前叫Gemini Advance)用户每月有100次生成额度,而更高级的Ultra计划(我们后面会提到)用户则可能有更多(甚至无限)的使用权。
它能让你通过自然语言提示生成场景、控制镜头运动、编辑和扩展镜头、搭建故事板,甚至还有一个Flow TV内容库。虽然目前生成的片段长度限制在8秒,但你可以将它们无缝衔接起来,还带有环境音效和Veo 3的音频生成功能。可以预见,从创作者、个体创业者到大型企业,都会发现它的巨大潜力。
第六名:Veo 3 —— 效果炸裂的AI视频工具与V2更新
Veo 3,这玩意儿最近在社交媒体上简直是刷屏级的存在!它是谷歌最新的顶级视频生成模型,比V2有了显著提升。最牛的地方在于它原生支持音频生成,包括环境音和角色对话! 想象一下,一个场景里有多个角色,AI能自动配上对话和背景音,这简直不可思议。
老实说,我看到Veo 3的演示片段时,下巴都快掉下来了。一个女歌剧演员在管弦乐队的伴奏下演唱,背景里的小提琴手,他们的动作和音乐居然能对得上!另一个片段里,一个女人在小型演唱会现场表演,鼓手的节奏、观众的氛围、歌手的口型,真实到令人发指。
目前,Veo 3主要提供给美国的Ultra订阅用户。但它的出现,真的让我开始思考:未来我们消费的视频内容,有多少会是AI生成的?我甚至大胆预测,在不久的将来(可能不是未来两年,但也许是2020年代末),我们观看的大部分内容,包括电视节目,都可能是AI制作的。
当然,这种技术的潜力也伴随着风险,比如虚假信息的传播。谷歌也在努力通过SynthID等技术来为AI生成内容打上“隐形水印”,但道高一尺魔高一丈,这方面的挑战依然巨大。
第五名:AI模式在谷歌搜索中的应用
这其实不算一个全新的东西,但它得到了极大的改进,并且部分功能也向免费用户开放了。简单来说,就是在谷歌搜索中增加了一个专门的AI驱动标签页(网页版和App都有),用来处理复杂查询并提供AI生成的答案。
新升级的功能包括生成自定义图表和图形,更自然地处理后续追问,以及一些新的购物功能,比如用个人照片进行虚拟试穿!是的,你没听错,你可以上传自己的照片,看看衣服上身效果怎么样。还有AI辅助结账功能,看来我的钱包要不保了。
在我看来,AI模式是谷歌在AI搜索领域的一种“对冲”策略。它既想通过AI概览来改进传统搜索,又想提供一个更纯粹的AI问答引擎,介于传统搜索和Gemini之间的体验。这个模式现在也由最新的Gemini 2.5模型驱动,还加入了深度搜索功能。
第四名:Gemini Live(结合Project Astra)
这是一款增强版的实时助手,可以通过设备的摄像头理解并与你周围的环境互动。安卓用户已经可以用上,iOS的部分功能也已上线,更多功能本周会陆续推出。
想象一下,你的手机助手能看、能听、能理解你看到的一切,还能帮你操作。你可以共享屏幕,用自然语音跟它交流。它甚至可以帮你打开YouTube搜索视频,从你的邮件里提取信息,识别墙上零件并根据手册找到正确的型号,帮你给自行车店打电话确认零件库存并下单,还能在你和别人聊天被打断后,继续刚才的话题!
这其中很多强大的功能,尤其是那些需要AI主动为你执行任务(比如打电话、控制应用界面)的能力,都得益于Project Astra技术的集成。这部分高级功能目前主要面向每月250美元的Ultra计划用户。但即便是免费版,其看图识物、实时识别等功能也已经非常强大。我们后面肯定会专门做一期节目来详细体验这个。
第三名:Gemini 2.5系列模型更新
是的,你没看错,世界上最强大的模型变得更强了!
特别值得一提的是Gemini 2.5 Flash,这个之前被认为是“轻量版”的模型,现在竟然是全球第二强的模型,仅次于它的大哥Gemini 2.5 Pro!这在以前是不可想象的,通常“轻量版”能排进前七八名就不错了。Gemini 2.5 Pro稳坐第一我们不意外,但Flash能有如此表现,简直是史无前例!
此外,Gemini 2.5 Pro也将迎来一个“深度思考模式”(Deep Think Mode),专供Ultra订阅用户。顾名思义,就是让AI花更多时间进行更复杂的推理和问题解决。虽然我个人不太喜欢新的“思考摘要”功能,更怀念之前那种更原始的“思维链”展示,但模型的整体能力提升是毋庸置疑的。
这些模型的进步意味着什么?很简单,无论你用的是哪个AI平台,都应该把它们作为你日常工作的起点,因为它们正变得越来越强大,未来也只会和我们的工作生活结合得越来越紧密。
第二名:谷歌AI Ultra订阅 —— 超级贵,也超级强
这是个大新闻,而且不全是好消息。我一直很欣赏生成式AI运动带来的技术民主化,大部分人花20美元就能用上世界顶尖的技术。但现在,谷歌也开始效仿OpenAI,推出了每月高达250美元的“奢侈品级”AI套餐。
好处是,你确实能获得令人惊叹的技术,对于企业来说,这个价格或许还能接受。但对于个人用户,除非你是小企业主或者对技术有极致追求,否则这个价格确实有点高。
更大的槽点在于,目前这个Ultra计划只对个人Gmail邮箱开放,企业版Workspace账户用不了! 谷歌,认真的吗?我希望能尽快在工作账户上用上这些强大的功能,比如个性化邮件、Gemini Live的上下文理解能力,如果只能在个人邮箱里用,那对我工作的帮助就大打折扣了。我当然理解企业级服务可能有更多技术和安全上的考量,但还是希望谷歌能尽快解决这个问题。
Ultra订阅包含了什么呢?Deep Research的最高使用权限、Veo 3的抢先体验权、Flow和Project Mariner(我们马上会讲到)的使用权、带“深度思考”的Gemini 2.5 Pro、YouTube Premium会员、30TB存储空间等等。前三个月优惠价125美元,之后恢复250美元/月。
第一名:Project Mariner(或称Agent Mode)—— 终极AI助理
这绝对是本次谷歌I/O大会上最重磅的发布!
简单来说,Project Mariner是一个能够自主完成在线任务的AI代理。 你可以把它想象成OpenAI的Operator,但它能接入你的数据。我已经试用了一下,目前感觉速度稍慢,但能力非常强大。
它最酷的地方在于:
- 可以同时处理多达10个任务,每个任务都在一个独立的“沙盒”中运行。
- 可以控制Chrome浏览器:移动光标、点击按钮、填写表单。
- 拥有“教学与重复”模式:这太牛了!你可以让它记录你的屏幕和语音操作,教会它执行一个复杂的、重复性的流程。比如,你每天都要查邮件、做研究、整理文档,理论上你可以教会Mariner来帮你做。
当然,目前这个“神兽”也只对美国的Ultra订阅用户开放,并且不能在Workspace账户上使用,这真是个巨大的遗憾。谷歌计划在今年夏天进行更广泛的推广。
想象一下,能够将那些重复、单调的日常任务自动化,跨多个平台操作,这对于提升效率的潜力是无限的!而且它仍然由Gemini 2.5驱动,具备强大的语言理解、思考和策略制定能力。我甚至想测试一下,Mariner能不能自己去调用其他的AI工具,比如让它自己去用Gemini或者其他AI产品来完成任务,这简直是“套娃”了!
呼,一口气讲了这么多,信息量确实有点大!从AI电影制作到能帮你干活的AI代理,谷歌这次真的是把压箱底的好东西都拿出来了。
这些新功能中,你对哪个最感兴趣,或者觉得哪个最有可能改变你的工作方式呢?