马斯克:这三款千问3.5 模型的表现都特别好,创下了中等尺寸模型的性能新高

3月2日,阿里巴巴宣布把Qwen3.5的小尺寸模型系列也给放出来了。这次总共出了4款,具体型号分别是Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B和Qwen3.5-9B。官方表示,这套系列继承了Qwen3.5家族的强大基因,用了原生多模态训练还有最新的模型架构,性能很强,不管是极端资源受限的设备还是高性能轻量级应用,都能满足需求。 到了3月3日,阿里又开源了三款中等规模的新模型,有Qwen3.5-35B-A3B、Qwen3.5-122B-A10B和Qwen3.5-27B。因为这次在架构上创新了不少,而且训练也突破了不少瓶颈,所以这三款千问3.5模型的表现都特别好,创下了中等尺寸模型的性能新高。这一下子吸引了市场的注意,马斯克看了也发表了评论。他觉得阿里巴巴的Qwen模型“智能密度”给人印象特别深刻。马斯克说的这个“智能密度”,意思就是说在同样的参数规模或者同样的算力消耗下,模型能表现出的逻辑推理能力、知识储备还有任务处理能力到底有多强。