月之暗面创始人杨植麟:中国大模型技术瞄准规则制定权 K系列将迭代至K100

在全球大模型竞争日趋激烈的背景下,中国本土AI企业正在加速追赶国际先进水平。

月之暗面作为国内大模型领域的代表性企业,近期在资本和技术两个维度均取得重要进展,为业界释放了明确的发展信号。

从融资规模看,月之暗面已完成5亿美元C轮融资,账面现金储备超过100亿元人民币。

这一充足的资金支撑为公司的长期技术研发提供了坚实基础。

同时,该公司的用户增长表现强劲,全球付费用户月增速达到170%,海外大模型API收入在新一代K2 Thinking模型带动下实现四倍增长。

这些指标表明,中国开发的大模型已开始获得国际市场认可。

在技术层面,月之暗面的创新聚焦于解决大模型发展中的两个核心难题。

其一是学习效率问题。

公司推出的MUON二阶优化器相比行业沿用十年的Adam优化器,将AI学习效率提升一倍,这意味着模型可以用更少的数据和算力完成同等质量的学习。

其二是长文本处理能力。

传统大模型在处理长文本时存在"记久了就出错"的问题,而月之暗面自主研发的Kimi Linear架构通过创新的线性注意力机制,使得百万字级长文本处理速度比传统架构快6至10倍,且逻辑稳定性显著提升。

在这些技术突破的支撑下,月之暗面的K2模型展现出了与国际先进水平相当的能力。

作为中国首个真正意义上的Agent模型,K2具备两三百步工具调用能力,能够独立完成复杂编程和难题推导等任务,在核心测试指标HLE中准确率达45%,超越了OpenAI同类产品。

这一成绩打破了中国大模型长期落后的认知,标志着本土技术已进入国际竞争的第一梯队。

值得关注的是,杨植麟提出了一个具有战略意义的观点——中国技术不仅要好用,还要参与制定规则。

这反映出国内AI企业正在从单纯的技术追赶向行业标准制定和国际话语权争取转变。

事实上,多款中国开源模型已成为行业测试标准,这种规则参与权的获得是中国科技实力提升的重要体现。

面向未来,月之暗面制定了明确的技术路线图。

公司计划在未来十年至二十年内,陆续推出K4、K5直至K100系列模型,持续迭代技术能力。

下一代模型将采用Kimi Delta Attention新型线性注意力机制,进一步提升短长文本任务性能。

同时,公司强调未来的大模型将具备更多"审美"和"价值观"特征,摆脱当前市场上大模型同质化发展的现象。

在AI安全问题上,杨植麟表达了理性的态度。

他认为,虽然AI发展存在风险,但放弃发展等同于放弃人类文明的上限。

大模型有潜力帮助人类攻克癌症、解决能源危机、探索宇宙等重大难题。

因此,正确的做法是在做好风险控制的前提下,持续推进技术突破。

大模型竞赛的终点不在某一次参数规模的刷新,而在能否以持续创新提升效率与可靠性,并以开放协作参与规则形成。

面向未来,只有把核心技术突破、产业化落地与安全治理放在同一框架下统筹推进,才能把技术优势转化为长期竞争力,为经济社会高质量发展提供更稳健、更可控的数字动力。