作加

智能交互新纪元:谷歌推出会“思考”的操作系统


界面不再固定,谷歌用 AI 重新定义操作系统

科技巨头谷歌最近展示了一项令人耳目一新的研究成果——“神经操作系统”(Neural Operating System)原型。这项技术打破了传统操作系统界面固定、操作预设的模式,首次实现了由 AI 实时生成界面的人机交互方式。

AI 实时“画”界面,用户操作即指令

与以往操作系统中按钮、菜单都由程序员提前编写不同,谷歌的神经操作系统采用了自家最新的大型语言模型 Gemini 2.5 Flash-Lite,根据用户的每一次操作实时生成新的界面。换句话说,用户不再是“在界面中找功能”,而是“用操作引导界面生成”,就像在一座会随你脚步变化的城市中行走,每一步都能看到新的风景。

双指令机制,让 AI 理解你的意图

为了实现这一创新,谷歌研究团队设计了一套巧妙的双指令系统。系统将用户的输入分为两部分:

  • 界面构成:定义系统的基本外观和风格;
  • 界面互动:记录用户的实时操作行为,并以 JSON 格式发送给 AI 模型。

Gemini 模型接收这些信息后,即时生成新的界面,确保用户在不断变化的界面中依然能保持操作的连贯性和一致性。

快如闪电的响应与智能缓存机制

谷歌的神经操作系统不仅聪明,还非常“快”。它采用了流式传输技术,使得界面几乎在用户操作的同时就能生成,极大提升了响应速度,避免了等待带来的不适。

更聪明的是,系统还引入了“生成式界面图”(Generative Interface Graph)来缓存已经生成过的界面。当用户再次执行类似操作时,系统可以直接调用缓存,不仅加快了响应速度,也增强了整体的稳定性。

学术界也在探索:NeuralOS 项目展现潜力

谷歌并非孤军奋战。学术界也在积极探索神经网络在操作系统领域的应用。例如,名为 NeuralOS 的项目就通过预测屏幕图像来动态生成界面,展示了 AI 在模拟操作系统行为方面的巨大潜力。

未来已来:交互体验或将全面升级

虽然目前谷歌的神经操作系统仍处于原型阶段,但其背后的技术理念已经展现出广阔的应用前景。未来,这种 AI 驱动的界面生成方式,或将彻底改变我们与设备的互动方式,带来更自然、更智能的使用体验。

了解更多技术细节:论文链接