2026年5月初,深圳国家超算中心没有大张旗鼓地宣传,“凌星”系统的硬件已经安装完成,它不使用任何进口GPU芯片,全靠四万七千颗华为鲲鹏CPU支撑起来,再加上三十六个网络机柜和十万多个核心,理论算力超过10Petaflops,这个数字听起来很惊人,实际上还比不上美国El Capitan那种达到1.7 ExaFLOPS的超级计算机,但“凌星”系统有一个重要特点,就是所有部件都是中国自主研发制造的。
我们不得不用CPU,这不是技术落后,而是被现实条件限制的,英伟达的H100和B200芯片买不到,ASML的光刻机也进不来,高端AI芯片根本拿不着,中国不能照搬美国那套“GPU加CUDA”的老路子,只能自己想办法,凌星公司就搞出来一个叫“Fusion架构”的设计,再配上SMT加速器,让CPU也能做混合精度计算,从高精度的FP64到低精度的INT8都能处理,单颗CPU推理速度到了每秒578个token,整个系统吞吐量提升了一百倍,在DeepSeek模型上测试的时候,效果比原先想的还要好,这说明只用CPU来做AI确实是有用的。
存储和散热方面做得挺扎实,容量有650PB,全球最大的液冷系统就在这里,包括67个机柜、428个节点,带宽达到10TB每秒,冷却管道总长3200米,整套系统重244吨,这么大的投入不是为了好看,而是实际要用到,比如做十年范围的气候模拟,还有积累全基因数据,没有这么大存储根本撑不住,液冷还能省电超过三成,跟国家提出的双碳目标正好一致。
过去几年里,中国超算在Top500榜单上的数量挺多,但性能数据常常没有公开,外界很难了解具体情况,凌星的做法不同,他们主动公布了架构细节、国产化比例和性能参数,这不像是在炫耀,更像是在表达一种态度,我们不怕别人看,也不怕别人比较。
有一个细节,欧美超算系统依赖AMD或Intel的芯片,背后有成熟的生态体系作为支撑,而凌星却是在断供的情况下硬是搭建起整条产业链,鲲鹏CPU、昇腾芯片和盘古大模型现在开始相互联动,以前总觉得CPU性能比不上GPU,现在看来,走的路不同,未必不能成功。
系统现在还在调整优化,要等到2029或2030年才能完全投入使用,这个系统会不会成为全世界最快的,没人能给出确定答案,但它的目标很明确,就是要摆脱技术受制于人的局面。