智谱“龙虾”大模型：从提效工具变成企业的劳动力

3月16日，智谱面向OpenClaw这种叫“龙虾”的任务场景推出了基座模型。有体验过的人都说，虽说能聊得挺好，但真正干活还得看本事。毕竟这活儿不光是一问一答，还得拆解任务、调用工具、衔接状态，甚至得盯着时间执行长流程，通用模型在这种复杂的真实环境里就容易出岔子，指令不听指挥、工具调用不稳、任务中途卡壳。为了把这些事儿从根子上解决，GLM-5-Turbo在训练阶段就开始围着龙虾的核心需求转了，重点练工具调用和指令遵循这一块儿。虽然这项新能力在咱们自研的ZClawBench评测里拿了国产第一，还获得了几家大厂的积极反馈，但对于那些天天得用智能体干活的用户来说，最要命的还是tokens不够用。举个例子，整理一次跨部门的会议纪要并分发任务，往往要来回调用工具几十回，这消耗的token比普通聊天多太多了。好在国内很多模型公司、云厂商都开始搞“龙虾套餐”了，大家可以根据自家的规模来选。这种需求这么旺，也直接给了物美价廉的国产初创模型厂商很大的机会。在最新的大模型排行榜里，月榜前三名几乎全被中国大模型给包圆了。智谱的相关负责人觉得，这次大模型的发展趋势很明显，正在从提效工具变成企业的劳动力。像OpenClaw这种智能体正在深入组织内部，让企业有了7×24小时随时在线的AI员工，也成了个人的专属AI助手。