AI 圈本周大乱斗!科技巨头们又开始“抢地盘”了!


这周的AI圈真是热闹非凡,有点“神仙打架”内味儿了!Meta瞅准了ChatGPT的市场份额,ChatGPT又把目光投向了谷歌的地盘,而谷歌呢,则在自家的一亩三分地里不断深耕,给自家王牌产品疯狂叠加AI新功能。

总之,这周的AI新闻依旧是信息量爆炸,节奏快得飞起!大家好,我是你们的博主,今天就来给大家扒一扒这周AI圈都发生了哪些值得关注的大事。咱们不整虚的,直奔主题!

话不多说,直接上干货!

1. 亚马逊 AWS 发布 Nova Premiere:企业级AI模型新标杆?

首先是亚马逊,AWS 推出了他们迄今为止最强大的AI模型——Nova Premiere。这货专为企业级应用设计,分析师们都说,这标志着亚马逊想在生成式AI的价值链里占据更多主导权。

  • 亮点速览:
    • 支持文本、图像、长视频等多种模态输入。
    • 高达75万字(100万token)的上下文窗口,终于让谷歌在这个领域有了点竞争压力!
    • 支持超过200种语言。
    • 最牛的是,它能在AWS Bedrock里进行模型蒸馏,企业可以用它生成合成训练数据,创建更小、更高效的模型(比如Nova Pro light和micro),还不需要标记数据集!据说蒸馏后的模型API调用准确率提升20%,延迟和成本还降低了,对边缘部署和资源受限的环境简直是福音。

专家们觉得,AWS 这波操作,重点不在于模型有多大,而在于掌控编排、定价和架构,以此来吸引那些追求可持续、灵活AI解决方案的企业。

2. Meta 不甘示弱,Llama 4 驱动的免费 AI App 正面硬刚 ChatGPT!

从一个万亿科技巨头转向另一个,Meta 这边也放了大招!他们正式推出了独立的 Meta AI 应用,现在iOS和网页版(meta.ai)都能用。这App由Meta最新的Llama 4混合专家(MoE)推理模型驱动。

  • 核心目标:
    • 提供更个性化、更整合的AI体验,还能在Ray-Ban Meta智能眼镜等设备上用。
    • 模型专注于学习用户偏好、保持对话上下文,并实现无缝的语音优先交互。
    • 用户可以用Meta账户登录,也可以用现有的Facebook或Instagram账号。这意味着Meta想把自家平台近40亿用户尽可能多地导流到这个新App里,明摆着就是要跟ChatGPT抢用户!
  • 功能特点:
    • 支持文本、图像和语音交互。
    • 有个特别的“发现”信息流,用户可以探索和混搭社区分享的提示词和创意输出,把社交和AI玩到一块儿了。
    • 语音功能(自然全双工对话)目前仅限美国、加拿大、澳大利亚和新西兰。
    • 注意: App本身目前还不支持实时网络信息访问(但meta.ai网站版可以),这点我觉得可能会让Meta在追赶OpenAI的路上稍稍有点吃亏。
    • Meta还在部分国家测试文档编辑和分析功能,未来AI能力不止于对话和创意。
    • 最酷的是,新的Meta AI App能和Ray-Ban Meta眼镜集成,对话历史和设置可以同步(虽然还不能在App上开始对话,然后在眼镜上继续)。我老婆送了我一副,我得赶紧试试这个新功能,说不定能让我更爱用它了!

3. 谷歌搜索AI模式全面开放(美国),购物和本地商家功能亮眼!

谷歌也没闲着,他们把Search Labs里的AI模式向所有美国用户开放了,不用再排队等候,让对话式、个性化搜索惠及更多人。

  • 新变化:
    • AI模式集成了谷歌的购物图谱,每小时更新超过20亿个商品列表(总列表超过450亿个),包括本地商店库存和全球零售商信息,找实时商品和价格更方便了。
    • 针对本地商家(餐馆、沙龙等)推出了新的可视化卡片,在AI生成的搜索结果里直接显示评分、评论、照片和库存更新,帮用户做更明智的决策。
    • 桌面端现在可以通过一个专门的面板恢复过去的搜索会话,不用从头开始,方便多步骤研究或项目规划。
    • 谷歌还在为一小部分美国用户测试标准搜索中的“AI模式”标签,这可能预示着生成式AI会更深度地融入其核心搜索产品。
    • AI模式在iOS和安卓的Google App上支持多模态查询,可以用文本、语音或图像搜索(比如通过照片识别产品或进行免提搜索)。

看得出来,谷歌正致力于把搜索变得更互动、更具操作性,不只是帮你找到信息,还能让你立马下单购物或预订服务。

4. Duolingo 大胆拥抱 AI:用 AI 取代合同工,效率翻倍?

语言学习App Duolingo这周也上了头条,因为他们宣布用AI取代了许多合同工。同时,他们在不到一年的时间里发布了148门新语言课程,使其课程数量翻倍,而以前开发这么多课程大约需要12个月。

  • “AI优先”策略:
    • CEO Luis von Ahn证实,AI现在承担了以前由合同工完成的工作,公司正转向“AI优先”的商业模式,以自动化重复性任务,减少对外部劳动力的依赖。
    • 去年他们已经裁掉了10%的合同工,当时就开始用AI进行翻译了。
    • Duolingo计划继续逐步淘汰那些AI可以胜任的合同工岗位,让全职员工专注于更有创造性和复杂性的任务,并为他们提供AI工具培训。
    • 未来,Duolingo在招聘和员工绩效评估中也会考虑AI的运用,团队在增加新的人力之前,必须证明新岗位的工作是AI无法自动化的。
    • 这种做法和Shopify最近要求员工在请求额外人力资源前,先最大限度利用AI的指令类似,反映了科技公司的一种新趋势。
  • 市场反应:
    • 华尔街似乎并不在意裁员,Duolingo最新财报超出预期,收入增长38%,主要得益于其积极采用AI加速内容创作和提高效率。

这事儿挺有争议的。我不是在鼓吹AI抢走大家的工作,但现实是,不管我们怎么想,大公司已经在这么做了。我个人认为,在未来(尤其是2025年底到2026年),如果你想招聘新职位或扩大团队,很可能首先要证明为什么AI干不了这份活儿。这听起来可能不舒服,但我觉得这会成为常态。

5. 特朗普发布AI生成“教皇”照引争议,时机敏感引批评

美国前总统特朗普在白宫官方社交媒体账户上发布了一张自己身着教皇服饰的AI生成图片,引起了天主教团体和公众人物的批评。

  • 背景: 这张图片发布于教皇方济各4月21日去世后不久,且梵蒂冈正准备举行秘密会议选举新教皇,时机尤为敏感。
  • 批评声音: 纽约州天主教会议谴责该图片“不敬”,“这张图片既不巧妙也不好笑”,并敦促特朗普在这一庄严时期不要嘲弄天主教信仰。
  • 白宫回应: 白宫为特朗普辩护,强调他此前曾访问意大利向教皇方济各致敬,并强调他对天主教徒和宗教自由的支持。

咱先抛开政治立场不谈,这事儿做得确实不太地道。在这么敏感的时期,用AI图像开这种玩笑,观感很不好。这也再次提醒我们,公众人物和组织在使用AI工具时,尤其是在哀悼期或重大事件期间,需要仔细考虑文化和宗教的敏感性。

6. 苹果与谷歌密谈:Gemini AI 或将登陆 Apple Intelligence?

据法庭文件披露,苹果和谷歌正在就将谷歌的Gemini AI模型引入Apple Intelligence进行深入谈判,谷歌CEO桑达尔·皮查伊证实了在2024年与苹果CEO蒂姆·库克的持续讨论。

  • 预期时间线: 交易预计在今年晚些时候敲定,与iOS 19的计划推出时间吻合,因此Gemini的集成可能会在苹果的WWDC 2025上宣布,并可能出现在早期的iOS 19测试版中。
  • 合作模式: 此前苹果与OpenAI就ChatGPT集成达成了协议,据报道双方没有直接的财务交易,而是互惠互利。目前尚不清楚与Gemini的交易是否会涉及付费。
  • 战略意义: Gemini的集成将标志着一个重大转变,苹果越来越多地将第三方AI模型整合到其Apple Intelligence套件中,可能为用户提供多种聊天机器人选项(如ChatGPT和Gemini)。此举可能有助于苹果应对监管挑战,通过向用户提供默认AI助手的选择权,尤其是在中国和欧盟等对AI和数字生态系统监管日益收紧的地区。

我个人觉得,不管苹果用谁家的模型,求求了,赶紧把Apple Intelligence做好用点吧!WWDC 2024上吹了那么多新功能,现在还没几个能用的,Siri还是老样子。如果跟谷歌合作能让我的苹果设备变聪明点,我举双手赞成!别让我的新iPhone白买了呀!

7. Anthropic Claude 放大招:集成多款工作App,高级研究模式上线!

Anthropic的Claude也没闲着,他们正在为其高级付费计划(Max、Team或Enterprise版)推出一些相当牛的集成功能。

  • 已连接的应用包括: Jira、Confluence、Zapier、Intercom等。这意味着Claude中的AI可以从这些工具中访问实时项目背景、任务状态和组织数据。
  • 能做什么: 连接工作应用后,Claude不再只是简单地回答问题,它可以在单个对话中执行操作,例如创建工单、总结文档以及跨平台自动化工作流程。我个人对Zapier的集成很感兴趣,因为它能连接数千种工具,这可能会极大地改变大语言模型的实用性。
  • 高级研究模式(测试版): 同样仅适用于高级付费计划,能让Claude进行长达45分钟的深度多源调查。它能将复杂查询分解成小部分,并从网络搜索、Google Workspace以及不同的连接集成中收集详细报告,并附带清晰的引用。
  • 网页搜索功能: 目前已向所有Claude用户全球开放。但这个新的、能跨多个连接进行深度研究的工具,目前仅限高级计划。
  • 未来计划: 之后还会集成Stripe和GitLab等更多服务。官方说这些功能“很快”会下放到Pro版。

希望如此吧!说实话,我觉得Claude每月20美元的基础付费版性价比一般,限制太多,用不了几下就到上限了,感觉像是逼着你买每月100美元的Max版。如果这些新集成功能真的好用,或许我会为了大家去升级体验一下,到时候再给大家出个测评!

8. 谷歌 Notebook LM 再升级:搭载 Gemini 2.5 Flash,支持50+语言音频摘要!

我个人超爱的谷歌Notebook LM又升级了!之前它运行的是Gemini 2.0 Flash模型,现在已经升级到了Gemini 2.5 Flash!

  • 重大提升:
    • 更强的思考能力: Gemini 2.5 Flash具备混合推理或逻辑能力,结合你上传的数百万字自有数据,在一个“接地气”的模型里运行,我已经迫不及待想多试试了!
    • 多语言音频概览: 备受欢迎且经常刷屏的“深度AI播客”(音频概览功能)现在支持超过50种语言,这得益于Gemini原生的音频特性,让内容更易于全球用户消费。
  • 关于 Gemini 2.5 Flash:
    • 你可以在Gemini App里作为实验性功能体验到它。如果你想知道2.0 Flash和2.5 Flash的区别,可以去谷歌的AI Studio里用同样的提示词跑一下两个模型,你会发现2.5 Flash强太多了!
    • 谷歌可能会改变Notebook LM的用户访问模式,未来2.5 Pro版本的免费访问权限可能会有变动。

Notebook LM是我心目中2024年的年度AI工具(如果还没用过,赶紧去试试!),它最大的好处就是能严格基于你上传的资料进行回答,不会胡编乱造,对新手特别友好,能有效减少AI幻觉。这次升级绝对是个大利好!

9. OpenAI 给 ChatGPT 加入购物功能:直接挑战谷歌和亚马逊?

还记得开头说的“抢地盘”吗?OpenAI 这就是冲着谷歌(可能还有亚马逊)来的!他们宣布,很快所有ChatGPT用户(无论是否登录,免费版还是付费版)都能通过集成在AI搜索查询结果中的“购物按钮”来购买商品,并直接跳转到商家网站完成结账。

  • 怎么用: 比如你想买个新办公椅或意式咖啡机,不用再花45分钟在亚马逊或谷歌购物上搜了,直接问ChatGPT,它会通过这个新集成帮你查看评论、文章、产品介绍等,用对话的方式回答你的问题。
  • 优势:
    • ChatGPT每周已经处理超过10亿次网页搜索,其中很多与购物相关(美妆、家居、电子产品等),说明AI辅助产品研究的需求很大。
    • 与谷歌购物(混合了付费推广和自然结果)不同,OpenAI的产品推荐目前完全是自然结果,没有赞助内容,专注于真实的用户评价。这点我非常看好!多少次在谷歌购物看到排在前面的以为是好东西,结果发现是广告,体验并不好。
    • ChatGPT的商品建议会优先考虑对话式、个性化的推荐,通过理解商品的优缺点以及用户的偏好(它能记住你聊天记录里的偏好!),而不是单纯依赖关键词算法。比如你一直喜欢高端货但又不想多花钱,它推荐咖啡机时可能就不会给你看胶囊咖啡机,而是推荐打折的意式浓缩咖啡机(意式咖啡机快来赞助我呀哈哈!)。
  • 商业考量: OpenAI的目标是到2029年实现1250亿美元的收入(去年不到40亿美元),联盟营销费用(就是你通过它买东西,它能抽成)可能会成为重要策略。
  • 潜在影响: 我觉得这招一出,虽然表面上是挑战谷歌,但亚马逊可能更慌。毕竟亚马逊自家的购物AI(那个叫Roffus的)体验嘛……一言难尽。如果ChatGPT这个购物体验真做得好,不仅能为OpenAI带来巨大收入,还可能彻底改变很多人的网购习惯。

本周AI新闻快速回顾:

  • 亚马逊AWS 推出最强AI模型Nova Premiere。
  • Meta 发布免费Llama 4驱动的AI应用,叫板ChatGPT。
  • 谷歌 全面开放美国区搜索AI模式,新增购物和本地商家功能;Notebook LM升级至Gemini 2.5 Flash。
  • Duolingo 因用AI取代合同工引关注,但营收表现强劲。
  • 特朗普 发布AI“教皇”照引争议。
  • 苹果与谷歌 据报接近达成协议,或将Gemini AI引入苹果设备。
  • Anthropic 为Claude高级版推出强大的应用集成功能。
  • OpenAI 在ChatGPT中引入购物按钮和购物功能。

呼,一口气说了这么多!这周的AI圈是不是信息量超大?AI的发展真的是日新月异,一周不看都感觉要掉队了。