智谱“龙虾”大模型:从提效工具变成企业的劳动力

3月16日,智谱面向OpenClaw这种叫“龙虾”的任务场景推出了基座模型。有体验过的人都说,虽说能聊得挺好,但真正干活还得看本事。毕竟这活儿不光是一问一答,还得拆解任务、调用工具、衔接状态,甚至得盯着时间执行长流程,通用模型在这种复杂的真实环境里就容易出岔子,指令不听指挥、工具调用不稳、任务中途卡壳。为了把这些事儿从根子上解决,GLM-5-Turbo在训练阶段就开始围着龙虾的核心需求转了,重点练工具调用和指令遵循这一块儿。虽然这项新能力在咱们自研的ZClawBench评测里拿了国产第一,还获得了几家大厂的积极反馈,但对于那些天天得用智能体干活的用户来说,最要命的还是tokens不够用。举个例子,整理一次跨部门的会议纪要并分发任务,往往要来回调用工具几十回,这消耗的token比普通聊天多太多了。好在国内很多模型公司、云厂商都开始搞“龙虾套餐”了,大家可以根据自家的规模来选。这种需求这么旺,也直接给了物美价廉的国产初创模型厂商很大的机会。在最新的大模型排行榜里,月榜前三名几乎全被中国大模型给包圆了。智谱的相关负责人觉得,这次大模型的发展趋势很明显,正在从提效工具变成企业的劳动力。像OpenClaw这种智能体正在深入组织内部,让企业有了7×24小时随时在线的AI员工,也成了个人的专属AI助手。