咱们这回凑一块儿说个特大利好,AMD直接掏出110万美金的巨额奖金池来悬赏,联合GPU MODE和Datawhale搞了个面向全球AI开发者的黑客松——AMD GPU MODE E2E SpeedRun,把端到端大模型推理性能的极限给彻底打开了。回想去年秋天搞的「AMD 2025 分布式推理算子优化挑战赛」,几百号高手在排行榜上斗智斗勇杀到最后一刻,不少在底层优化上有真本事的人都被咱们看在眼里。今年春天这事儿接着搞,就给大家发榜了!这个大赛只盯着AMD GPU开源模型的优化,只要实力够硬,完全可以双线作战去抢那百万美金的大奖。 咱先把比赛规则跟大家伙儿讲透。这次玩法是双阶段赛制,能留到最后的肯定是地表最强的架构师。头一个阶段就是预选赛,参赛选手得对三大核心GPU算子使劲打磨:MXFP4 MoE、MLA Decode和MXFP4 GEMM。把这几个底层运算的极限给掀起来就行。第二个阶段是总决赛,那才是真正的硬仗。TOP 10的队伍能拿到AMD提供的单节点8卡云端Instinct™ GPU集群,在极限并发下挑战两个明星模型:DeepSeek-R1-0528和Kimi K2.5。 再说说时间节点,报名和预选赛从北京时间2026年3月7日上午8点开始,一直干到4月7日下午14点59分。接着决赛从4月8日0点开启,持续到5月16日下午14点59分。到了5月19日那天,全球颁奖典礼要正式举行。 报名方式也很简单,个人或者最多三个人组队都能来搞。面向全球的AI开发者、ML研究人员、系统工程师和开源贡献者开放,第一步就是完成在线报名,加入AMD AI Developer Program去领官方弹药库。第二步是查一下预选赛的参考kernels,用Popcorn CLI完成提交就完事。 这次的合作阵容也很强大,AMD联合GPU MODE发起活动,魔搭社区和Datawhale给撑腰提供技术支持、资源分享和社区交流。欢迎所有对GPU性能优化、LLM推理加速、开源算子挑战感兴趣的开发者赶紧扫二维码报名吧!