在深圳长大的AI少年陈广宇最近可是火了一把,他跟两位同行张宇还有苏剑林一起搞出了一项名叫《AttentionResiduals》(也就是“注意力残差”)的论文,成为了整个中国人工智能公司“月之暗面”的首席发言人。这家公司可厉害,在发布会后就立马把这事儿闹大了。这篇论文不只是让陈广宇17岁年纪就被推到了聚光灯下,更关键的是,它可能真的要改变未来。你要知道,陈广宇现在就读于贝赛思体系学校,这所学校本来就以教得好还有创新出名,这下子更出名了。 苏剑林在博客里详细说明了这篇论文的厉害之处,特别是陈广宇和张宇提出来的BlockAttnRes设计。你看,他们两个把这个设计搞出来之后,解决了“注意力残差”方法在实际应用时开销太大的问题,这可是把这个新架构推向实用的关键一步。以前那些大模型训练起来可是又费显存、又费通信、又费计算,搞不好就要卡死了。但是现在好了,他们这个设计把这些额外成本都降下来了,大模型训练效率直接提升了25%。这绝对是个大新闻啊! 就在论文发布的当天,埃隆·马斯克在网上看到了这个消息后马上转发点赞说这玩意儿“太牛了”。这下子不仅给陈广宇的研究加了好多分,也让全世界都开始关注他们这群人了。就连前OpenAI的研究员Andrej Karpathy还有Jerry Tworek这些大牛都纷纷站出来给个好评,说这是深度学习2.0时代来了。后来在英伟达的GTC2026会议上,“月之暗面”的杨植麟作为唯一受邀的中国人工智能公司代表上台讲话时还专门提到了这个设计有多重要。 对于这些外界的关注和夸赞,陈广宇自己也挺高兴的。他在社交媒体上发了条状态说:“这可能是改变大语言模型历史的工作。”不过说完感慨之后他马上又说:“感慨完毕,回归正事。”看得出来他对科研还是非常热爱和专注的。咱们继续关注这个年轻人的成长吧,说不定以后还会有更多惊喜等着我们呢!