告别手动提示:ChatGPT 任务回归、Claude 设计大升级与 Codex 自动化等 7 项 AI 新功能指南
本周 AI 领域迎来了一波对商业与工程用户极具实用价值的更新。从后台智能调度到设计开发无缝衔接,再到多模型融合与自动化流程录制,AI 代理正朝着“减少手动干预、强化主动执行”的方向加速演进。以下是目前最值得你立即部署的 7 项核心功能详解。
1. ChatGPT 定时任务(Tasks)强势回归,体验全面升级
OpenAI 已正式下线每日主动摘要功能 Pulse,并将其全面替换为重构后的 ChatGPT Tasks。该功能曾一度在部分付费计划中被 Pulse 取代,如今已全面回归并逐步向所有付费用户开放。
* 后台主动执行:允许 ChatGPT 在后台按计划执行工作,包括设置提醒、管理周期性任务以及监控联网应用。
* 统一管理中心:侧边栏新增专属“计划页面”,用户可集中查看、暂停、恢复、编辑或删除所有活跃任务。
* 智能调度机制:最大亮点在于免去了手动设定检查频率的繁琐。例如,只需输入“关注竞品页面,有更新时通知我”,系统会自动判断最佳检查时机并推送通知。
* 生态数据联动:深度集成 Gmail、Google Calendar 和 Google Drive,可基于实时数据自动生成每日早报。目前单次最多可创建 10 个任务,全平台(Web/iOS/Android)可用。免费层级暂未开放,但已有开放迹象。
2. Claude Design 六月大更新,打通设计与开发工作流
初期的 Claude Design 虽然输出质量尚可,但工作流割裂且风格高度模板化。本次更新彻底重构了底层交互与集成逻辑:
* 真·所见即所得(WYSIWYG)编辑器:支持类似 Canva 或 Wix 的直接点击编辑、拖拽、缩放和精准对齐,并修复了数百项稳定性问题,大幅提升了生产环境下的可用性。
* 企业级设计系统导入:支持从 GitHub 仓库、设计文件或直接上传导入自有组件库。Claude 将严格基于导入的组件生成界面,而非凭空捏造样式。
* 设计到代码的无缝闭环:导入的组件库与 Claude Code 完全同源,真正实现了从“设计原型”直接对接“生产代码”的免重构流转。
* 多格式导出与第三方集成:新增 PDF 和 PowerPoint 导出功能,并原生打通 Canva、Gamma、Lovable、Miro、Vercel 和 Wix 等主流平台。该功能目前面向所有 Claude 付费计划(Pro/Max/Team/Enterprise)提供 Beta 测试,桌面端侧边栏已新增专属入口。
3. Google Vids AI 虚拟人全面进化
Google Vids 结合了 Gemini Flash 系列文本转语音技术与最新 Veo 3.1 视频模型,大幅提升了 AI 虚拟人的真实感、表现力与可控性。
* 风格库扩容与时长突破:默认预设从 23 个增至 53 个,涵盖写实摄影、3D 卡通和漫画风格。视频生成功能彻底打破此前 8 秒的时长限制,支持无限时生成。
* 文本指令精准驱动:支持通过自然语言提示词指挥自定义虚拟人进行走动、对话及与场景物体互动(如拿起道具、跨屏移动),彻底告别 AI 视频常见的机械僵硬感。
* 幻灯片一键转视频:新增 Google Slides 深度集成,点击即可将静态演示文稿转化为动态视频。美国用户可免费使用(每月 10 次 Veo 生成额度),付费 Workspace 计划提供更高配额。
4. OpenRouter Fusion:多模型并行融合引擎
OpenRouter 推出的 Fusion 功能允许用户将同一提示词并行发送给多个 AI 模型,随后由一个独立的“裁判模型”综合评估各模型输出,并生成单一最优结果。
* 灵活预设模式:提供“高质量”(组合前沿旗舰模型)与“高性价比”(组合 Flash 轻量模型)模式,用户也可自定义模型池。
* 零基建调用:已从实验性功能全面集成至 OpenRouter API,支持 128K 上下文窗口。用户无需自行搭建复杂的模型路由与评判架构,即可一键实现“多模型交叉验证+裁决”的高级工作流。特别适合需要处理高风险复杂查询的研究团队,或希望以可控成本获取前沿推理能力的开发者。
5. Claude Code Artifacts:代码会话的可视化实时共享页
该功能将备受好评的 Artifacts 概念正式引入 Claude Code 环境,目前面向 Team 和 Enterprise 用户开放。
* 动态开发看板:Claude Code 可将编码会话的进度、上下文与逻辑自动转化为可共享的可视化页面,适用于 PR 演示、系统架构说明、动态数据仪表盘和自动化发布清单。
* 实时同步与版本追溯:每个 Artifacts 均生成持久化 URL,支持版本历史记录与组织级画廊管理。团队成员在浏览器中打开链接即可实时查看最新状态,页面内容随 Claude Code 的发布自动刷新,无需人工同步数据。该功能比同类网页工具更侧重工程开发视角,是工程团队追踪交付成果与产品管理的利器。
6. GLM 5.2(智谱AI):当前最强开源权重模型
智谱AI(ZAI)发布的 GLM 5.2 是一款基于 MIT 商用开源协议的 753B 参数混合专家(MoE)模型,完整权重已上架 Hugging Face。
* 基准性能领跑:在 Artificial Analysis 智能指数中位列开源模型榜首,综合评分超越 Gemini 3.1 Pro。上下文窗口大幅扩展至 100 万 token。
* 长周期编程与成本优势:专为长时间自主编程和复杂工程任务设计。测试显示,其在多项长周期代码基准中优于 GPT-4.5,且推理成本仅为后者的六分之一。目前在前端代码生成公开榜单中稳居第一。
* 企业级自主部署:宽松的 MIT 协议支持完全自托管、微调与物理隔离部署。对于追求 Token 效率、数据隐私及供应商中立的大型企业,该模型是极具战略价值的基础设施选项。
7. OpenAI Codex Record and Replay:录制工作流,一键封装为技能
这是本批次更新中最具落地效率的自动化工具。其交互逻辑极其直观:点击录制,正常完成操作,Codex 全程学习操作轨迹,并自动打包为可随时调用的可复用技能(Skill)。
* 精准匹配复杂场景:专攻重复性高、依赖个人操作习惯或“演示比文字描述更直观”的业务流程(如财务报销、工位预订、工单标准配置、视频发布、周期报表拉取等)。
* 降维打击传统 RPA:生成的技能可直接与电脑底层控制、浏览器自动化及已连接插件联动。相比 UiPath 等传统 RPA 工具,其配置门槛大幅降低,且能完美继承用户在 Codex 中已有的项目环境与插件上下文。
* 可用性说明:目前仅限 macOS 平台,暂不覆盖欧盟、英国和瑞士地区。需订阅付费 ChatGPT/Codex 计划。官方团队透露,未来版本或将支持录制过程中的实时语音旁白指令,进一步简化技能封装流程。
