Solaris来了:首个多人视频世界模型引爆AI界,估值35亿美元背后的协同智能革命
2026年3月11日,AI视觉领域一个沉寂已久的“名字”突然刷屏全球科技圈——谢赛宁。这位DiT(Diffusion Transformers)的原创作者、生成式AI底层架构的关键推手,没有止步于单帧图像或单视角视频的突破,而是携全新项目 Solaris 重磅回归:全球首个真正意义上的多人视频世界模型正式发布。
这不是又一个“能生成视频”的工具,而是一次范式跃迁——从“一个人看一段视频”,走向“一群人实时共处一个动态、连贯、可交互的视觉世界”。
🌍 不再是“伪多人”:它让多个AI玩家真正“看见彼此”
过去几乎所有视频生成模型都默认一个前提:世界只围绕一个主体展开。哪怕画面里出现多人,也多是静态摆拍、视角割裂、动作不同步——本质上仍是“单人叙事”的变体。
Solaris打破了这一天花板。它的核心创新在于一个名为 “多人自注意力层”(Multi-Agent Self-Attention Layer) 的新机制。这个模块不是简单地把多个视频流拼在一起,而是让模型在每一帧生成过程中,显式建模不同角色之间的空间关系、视线交互、动作依赖与意图对齐。
实测结果令人振奋:在《我的世界》开放沙盒环境中,4名AI“玩家”同步协作建造一座城堡——有人挖地基、有人搭塔楼、有人铺设红石电路。Solaris不仅保证了建筑结构在三维空间中严丝合缝(无穿模、无悬浮),更让所有角色的动作节奏、视角朝向、光照反射完全一致。画面没有一秒“掉线”,也没有一次逻辑崩塌。
这背后的技术底座,正是昆仑天工2025年8月开源的 Matrix-Game2.0 ——一个专为长序列、高并发、强交互场景设计的世界模型框架。Solaris并非另起炉灶,而是在其坚实土壤上开出的第一朵协同之花。
💰 10.3亿美元种子轮融资,杨立昆亲自坐镇巴黎总部
技术震撼业界,资本反应更快。
随着Solaris亮相,谢赛宁联合创立的AI公司 AMI(Artificial Multi-Intelligence) 首次浮出水面。这家公司由图灵奖得主、深度学习先驱 杨立昆(Yann LeCun) 于2026年1月在法国巴黎正式成立,并亲自担任首席科学家。
更引人注目的是其融资规模:种子轮即斩获10.3亿美元,融资前估值已达 35亿美元——创下全球AI初创公司种子轮估值历史纪录。值得注意的是,这笔资金并非来自传统风投机构,而是由欧洲数字主权基金、日本机器人产业联盟及三家头部游戏引擎厂商联合领投,凸显产业界对“多人交互世界”底层能力的迫切需求。
谢赛宁在AMI担任联合创始人兼首席科学官(CSO),主导Solaris及其下一代架构的研发。他坦言:“单智能体的世界模型,就像一台永远只能演独角戏的摄像机;而Solaris的目标,是造出一整套能导演群戏、调度灯光、理解潜台词的‘AI制片组’。”
🛠️ 开源即战力:开发者今天就能跑起自己的“多人视频宇宙”
和许多闭源大模型不同,Solaris选择了一条更务实、更具生态野心的路径:全部训练代码、轻量化推理接口、Minecraft协同测试套件,已面向全球开发者免费开放下载。
这意味着,独立游戏工作室可以用它快速构建支持10人同屏协作的VR沙盒;教育科技公司能生成带师生互动反馈的沉浸式实验课;具身智能团队则可将其作为虚拟训练场,让多个机器人代理在统一物理世界中完成复杂协同任务。
一句话概括Solaris的定位:它不替代你的视频生成管线,而是升级你的“世界操作系统”——从此,生成的不再是片段,而是具备时间连续性、空间一致性与主体交互性的动态世界。
🔮 下一站:从“演视频”到“活世界”
当AI不仅能生成画面,还能理解谁在看谁、谁在帮谁、谁在等谁……我们正在跨越的,就不仅是技术指标,更是人机关系的临界点。
Solaris不是终点,而是一个清晰的路标:
✅ 视频生成正从“感知层”迈向“社会层”;
✅ AI世界模型正从“单核CPU”进化为“多核分布式系统”;
✅ 虚拟现实的终极形态,或许不是更炫的头显,而是更可信的“共同注意力”。
正如杨立昆在AMI巴黎总部揭幕时所说:
“我们不再问‘AI能不能生成一段好视频’,而是问——‘它能不能成为一群人共同相信的那个世界?’”
Solaris的答案,已经写在第一行代码里。
