交互延迟压至500ms以内:智元WITA拿下全国首张合规备案,机器人“社交时代”正式开启
过去看人形机器人,我们多半是在惊叹它们步态多稳、关节多灵活,可一旦需要开口对话,往往会陷入“四肢发达、只会念稿”的尴尬。如今,这个长期卡住行业脖子的痛点,终于被一张牌照悄然打通。
上海市网信办近日发布的公告显示,智元机器人旗下的 WITA(硅光动语)大模型已正式完成备案。这不仅是具身智能赛道的一张“准生证”,更是全国首个专注交互场景、合规落地的具身智能大模型。对于整个行业而言,这意味着机器人交互从此告别“裸奔”时代,正式进入标准化、可商用的新阶段。
从“执行工具”到“硅基伙伴”
WITA 的底层设计逻辑非常明确:不追求大而全的通用问答,而是死磕“拟人交互”。它赋予了机器人连续记忆能力与鲜明的人格特质,让冷冰冰的金属躯壳能听懂弦外之音、接住情绪波动。在已经跑通的导览、服务零售等商业场景中,WITA 正逐步补齐机器人“能干活但不会聊天”的短板,让人机对话从单向指令升级为有温度的双向互动。
三季度王炸:延迟<500ms的“真·实时对话”
合规落地只是起点,智元的技术路线图显然更具野心。官方已确认,今年三季度将正式发布 WITA Omni 1.0。作为行业首个机器人原生的端到端全模态交互模型,它的核心突破落在极致的体验上:
- 压至 500ms 内的交互时延:响应速度几乎贴合真人聊天节奏,支持正常语速下的连续交流。
- 支持随时插话与打断:你不再需要像对语音助手那样耐心听完,可以随时纠正、追问,模型会实时调整语气与情绪反馈。
- 全模态肢体协同:彻底告别“嘴动身不动”的割裂感,语言、语音、微表情与肢体动作实现底层联动,交互自然度呈指数级跃升。
更值得关注的是其“多模态交互数据飞轮”机制。模型在真实商用场景中会不断吸收交互数据,持续自我迭代。换句话说,它具备“越用越聪明”的闭环进化能力。
百亿到千亿:具身智能的商业化拐点已至
技术突破的背后,是清晰的商业变现野心。在首届香港具身智能产业峰会上,智元联合创始人、总裁兼 CTO 彭志辉首次公开“358宏图计划”:目标 2027 年营收突破 100 亿,2030 年向 1000 亿规模冲刺。
这份看似激进的业绩对赌,实则折射出整个赛道的底层逻辑切换。具身智能已经跨越了“技术验证与概念炒作”的早期阶段,正加速驶入“规模化落地与商业造血”的深水区。当合规性、交互体验与数据飞轮同时就位,人形机器人走进家庭、商场与办公区,将不再是科幻片里的远景,而是正在发生的产业现实。
