DeepSeek打败mata成为开源AI大模型的领头羊


中国AI公司DeepSeek开源的最强推理模型DeepSeek R1,正在引发美国科技界地震。Meta(就是以前的脸书)的AI团队现在超级紧张,开了4个“作战室”紧急研究中国的技术。这事儿也暴露了美国AI行业的一些问题。

Meta发现中国的团队用550万美元就训练出了比Llama还牛的模型,但是Meta高管的年薪都比这个数还高。扎克伯格的团队现在很尴尬:他们养着那么多高薪的管理层和团队,结果做出来的模型没OpenAI的厉害,花的钱还更多?

Meta的工程师们现在拼命研究DeepSeek的三个秘密:一是怎么把训练成本降到美国的十分之一;二是用了啥神秘数据让模型性能这么好;三是用了啥“模型分拆”技术让AI跑得更快更省资源。更让人难为情的是,DeepSeek把这些技术都开源了,但是Meta到现在还没完全学会。

Llama虽然开源了,但是运行成本太高,没人愿意用。DeepSeek的开源生态却吸引了全球的开发者,大家一起努力让技术越来越好。

有意思的是,Meta现在也想抄DeepSeek的作业,把一个AI模型拆成很多个小模块,用的时候再挑着选。DeepSeek的这个技术正在改变全球AI行业竞赛的规则。

中国这次换道超车的战略极具智慧:通过完全开源来建立全球生态,这样既能绕过美国在芯片上的限制,又能掌握技术标准的话语权。美国还在用老办法“泼脏水”,DeepSeek已经用开放的心态团结了全球开发者。格局不一样,结果可能也会不一样。就像谷歌用安卓用开源战胜苹果一样,中国正用同样的战略在AI赛道实现超越。