中国大模型创业公司阶跃星辰发布agent 基座模型的预训练权重(base)、中训练权重(midtrain)和配套的

中国大模型创业公司阶跃星辰发布了Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)和配套的Steptron训练框架,把这次3月4日的开源行动进行得非常彻底。虽然目前大模型开源环境相对保守,但他们的行动在社区引发了热烈反响。Flash采用稀疏MoE架构,总共有1960亿参数,不过在实际推理时只激活了大约110亿参数。他们把这个设计给复杂推理和长链任务的表现提升到了很高水平,官方说它在深度上能和一些顶级闭源模型一较高下。这一发布不仅展示了中国模型在全球Agent生态中的强大实力,还进一步加速了中国模型在全球Agent平台上的渗透。Step 3.5 Flash是专为智能体(Agent)场景设计的,同时搭配了专门为该场景开发的Steptron训练框架。在单请求代码任务下,它把推理速度提升到了350 TPS。这次开源把所有相关内容都放了出来,包括权重和框架。OpenClaw等Agent平台持续升温的情况下,阶跃星辰这个举动更是给这个趋势注入了一剂强心针。通过这次开源行动,Flash成为了小龙虾上备受关注的焦点。