t点击上方蓝字·关注我们
中国人工智能公司月之暗面(Moonshot AI)的Kimi团队近日发表一篇论文,提升了AI大模型的效率。埃隆·马斯克在社交平台评论称“Kimi的工作令人印象深刻”。

Kimi团队的这篇论文对AI大模型的底层架构进行改进,算力效率提升1.25倍,推理延迟增加不到2%,且可直接替换标准残差连接。这为提升大模型能力提供了除堆参数、堆算力之外的新思路,即通过优化底层结构来提高效率,可能促使模型设计重新关注“加深深度”的路径。
该研究对AI界影响很大,马斯克评论这个论文时说:“Kimi的工作令人印象深刻。”
随后,这篇同日发布的技术论文中,排在作者名单第一位的“Guangyu Chen”,因其“17岁高中生”身份,引发社交平台关注。

经核实,“Guangyu Chen”即陈广宇。论文附录显示,他与张宇、苏剑林三人被标注为“同等贡献”,位列共同一作。张宇是Kimi高效模型架构的重要研究者,苏剑林则是提出了被主流大模型广泛采用的旋转位置编码(RoPE)的知名研究者。
陈广宇是深圳一所国际学校的高三学生,预计今年6月毕业。
其社交媒体信息显示,他已拥有顶尖竞技编程背景,参加过美国计算机奥林匹克竞赛铂金组比赛,在Kimi内部拿下48小时“黑客马拉松”比赛冠军。
从2025年11月至今,他在Kimi担任机器学习研究员,参与中国最顶尖的开源大模型的核心研发,已经从“学生”变成“一线贡献者”。此前他入选罗德信托的高潜力未来领袖计划,这是面向全球15–17岁潜力青年的选拔计划。他还在美国顶尖小型实验室Tilde Research做过AI研究。
不过Kimi官方和陈广宇都强调,这项研究是一个团队工作。陈广宇说,这样的论文不太可能由一个人写出来,kimi的成员都有投入,不少人做出同等贡献。17岁的年纪
一作的成果,谦虚的态度

广东启动县城高中振兴行动,确保2030年普高入学率达70%
广东对医院床位费、救护车转运“爬楼费”等划定明确红线
2月起,广州机关事业单位停车场将有序开放
综编自广东发布、扬子晚报