时空一体:复旦系发布全球首款机器人原生大脑,半年斩获5轮融资
通用人工智能的竞赛,正在从数字世界烧向物理世界。当大语言模型还在卷参数、卷算力时,更具挑战性的命题已经摆在眼前:如何让AI在真实环境里不仅”看得懂”,还能”动得了、做得好”。
5月31日,来自复旦大学深度学习实验室的具身智能企业眸深智能,正式交出了他们的答卷——STI-WM时空一体世界动作模型。官方将其定位为全球首款专为机器人原生打造的通用具身大脑。
当前行业主流的VLA(视觉-语言-动作)模型,虽然在实验室里表现亮眼,但一旦面对真实场景,往往会在空间感知、长时序规划和真机鲁棒性上”翻车”。本质上,它们更擅长”看图说话”,而非在物理世界里真正”动手干活”。
STI-WM的破局之道,在于首次将空间结构、时间演化、物理一致性与执行鲁棒性四个维度融为了一体。模型能够兼容RGB图像、深度点云等多模态感知输入,将复杂环境编码为结构化的时空状态;在上层,它可以对未来进行百秒级的长时程任务推演;在下层,则能输出足够精细的动作指令。这种”理解世界、推演未来、规划动作、执行纠错”的闭环,让它跳出了纯视觉推演的局限。
支撑这套体系的,是眸深智能全链路自研的六大核心技术壁垒。除了时空一体化原生架构和基于点云的三维感知外,模型内置的物理一致性引擎通过碰撞检测与动力学约束,从根上否决违背物理规律的动作。更关键的是,团队通过自研的模型压缩与量化蒸馏技术,成功让百亿级参数的大模型”瘦身”,得以在机器人端侧芯片上轻量化部署,大幅降低了产业落地的算力门槛。
这支被誉为”复旦铁三角”的团队,配置堪称产学研的”顶配”。复旦大学陈涛教授坐镇科研,前英特尔中国首席科学家张益民博士与英伟达技术负责人主导工程落地,而商业化则由95后复旦连续创业者穆泽林操盘。自2021年起,团队已完成7代动作模型的迭代,并曾斩获ICCV和CVPR等全球顶级赛事冠军。
硬核的技术实力,迅速转化为了资本市场的热烈回应。眸深智能在短短半年内密集完成5轮融资,其中3亿元的Pre-A轮融资更是获得了5倍超额认购。这样的融资节奏,在硬科技赛道上并不多见。
商业化层面,这家公司也已走出实验室。目前,眸深智能已与宇树科技、禾川科技、颐家养老等多元真实场景的头部企业达成深度合作,战略合作伙伴中5家以上为千亿级产业龙头。据公司预计,未来三年可锁定10亿元的订单支撑,全面加速人形机器人、四足机器人等多品类硬件的规模化落地。
当物理世界的AGI从理论走向产线,一颗专为机器人原生打造的”时空大脑”,或许正在定义下一代智能机器的基线。
