MIT新星OpenAGI发布革命性AI助手Lux:操作电脑比人类还准,成本却只有同行1/10


一位MIT博士的野心:让AI真正“会用”电脑

在AI代理(AI Agent)赛道日益火热的今天,大多数模型还在浏览器里“打转”——能点点网页、填填表单就算不错了。但一家来自麻省理工学院的初创公司 OpenAGI 正在掀起一场静默革命。他们推出的全新AI代理 Lux,不仅能操作浏览器,还能像人类一样使用Excel、Slack、邮件客户端等桌面软件,甚至在性能上大幅超越OpenAI和Anthropic的同类产品。

更令人震惊的是:它的成本只有对手的十分之一

Lux有多强?基准测试结果令人侧目

在最新的 Online-Mind2Web 基准测试中,Lux交出了一份近乎“学霸级”的答卷:83.6%的任务成功率。相比之下,OpenAI的Operator得分为61.3%,Anthropic的Claude Computer Use仅为56.3%。这意味着,当面对复杂的跨应用操作任务时,Lux不仅理解更准,执行也更稳。

这不只是数字上的领先,更是能力维度的跃迁。当前市面上多数AI代理仍局限于网页环境,而Lux已经能深入操作系统层面,直接操控本地应用程序——比如自动整理Excel表格、在Slack中发送结构化消息、甚至跨软件提取和整合信息。

不靠“读文字”,而是“看屏幕”学习

Lux的强大并非偶然。它没有沿用传统大模型“文本训练+提示工程”的老路,而是采用了一种名为 “Agent主动预训练” 的全新方法。

简单来说,Lux是通过观察屏幕截图和对应的操作序列来学习的。就像一个实习生坐在电脑前,看别人怎么点击、拖拽、输入,然后自己模仿练习。这种训练方式让Lux真正理解了“图形界面”背后的逻辑,而不是依赖开发者写好的API或脚本。

更关键的是,这套系统具备自我强化的学习循环:每一次成功或失败的操作都会反馈到模型中,让它越用越聪明,逐渐从“能做”进化到“做得好”。

低成本、高效率,开发者生态已开放

除了性能惊艳,Lux的经济性也极具颠覆性。OpenAGI声称,其运行成本仅为OpenAI和Anthropic前沿模型的十分之一,同时响应速度更快,延迟更低。

这一优势背后,是团队对模型架构和训练流程的深度优化。他们证明了:小团队也能在AI军备竞赛中杀出重围,用更聪明的方法实现超越。

为了让更多创新落地,OpenAGI已正式发布 开发者SDK,允许企业和个人基于Lux构建自己的自动化工具。想象一下:财务人员一键生成报表,客服系统自动调取用户历史记录,HR系统跨平台筛选简历——这些场景正在变得触手可及。

安全是底线:AI不会“越界执行”

随着AI代理获得越来越多系统权限,安全问题成为悬顶之剑。对此,OpenAGI早有准备。

Lux内置了主动安全机制:当检测到请求可能涉及隐私泄露、恶意操作或违反政策时,模型会自动拒绝执行,并向用户发出明确警告。这种“有原则的AI”设计,为未来大规模部署提供了信任基础。

背后的灵魂人物:一位低调的技术极客

带领这支团队的是CEO 秦增义博士,一位在AI领域深耕多年的实战派科学家。他曾参与多个知名AI模型的研发,技术视野深厚。在他的带领下,OpenAGI展现出惊人的执行力和创新力——用更少的资源,做出了更具突破性的产品。

结语:AI代理的“下一幕”已经开启

Lux的出现,或许标志着AI代理正从“辅助对话”迈向“真实操作”的新时代。它不再只是一个聊天机器人,而是一个能真正替你在电脑前“干活”的数字员工。

当性能、成本、安全性三者同时突破,我们或许正在见证一个新平台级技术的诞生。而这一次,起点在MIT的一间实验室里。