全球最大开源大模型提供者,像qwen、deepseek、kimi 这些都排在前列

中国科技公司在春节假期前夕进行了一系列大动作。就在除夕那天,阿里巴巴给大家带来了全新的千问Qwen3.5-Plus,这个模型总共有3970亿个参数,激活的只有170亿个。这样一来,部署时需要的显存少了60%,既能保持能力又能提升速度。Qwen3.5-Plus的整体实力已经超过了Gemini3 Pro,很多权威测试都被刷新了纪录。API价格每百万个Token(字符)只有0.8元,比Gemini3 Pro便宜了很多。最值得注意的是,千问3.5在文本和视觉混合数据上进行了预训练,实现了多模态方面的新突破。这个模型在推理、编程和Agent智能体等方面表现都很出色,在视觉理解能力的评测中也拿到了多项最好的成绩。中国科技公司给这个春节准备了不少新玩意儿:智谱宣布上线并开源GLM-5,称它是Agentic Engineering时代最好的开源模型;科大讯飞和MiniMax也带来了他们的新产品——星火X2大模型和M2.5模型;字节跳动的AI视频生成模型Seedance2.0也引发了广泛关注。回顾一下2025年的春节假期,阿里云通义团队发布了Qwen2.5-Max,DeepSeek迎来了大量新平台接入。上海财经大学特聘教授胡延平觉得这些新模型越来越实用了。过去三分之一的体能量就能完成同样的任务。解码吞吐量还翻了好几倍。业界认为Qwen3.5的意义不只是刷新纪录。 过去几年,大家都在相信参数多了就好,结果性能是上去了,成本也跟着涨。很多中小企业根本用不起这么大的模型。Qwen3.5的思路就是不一样,它不追求参数有多大,而是让模型变得更聪明。更小的模型就能解决更多问题。多模态方面也有很大突破,不仅仅是读懂一张图片这么简单。它能理解视频里发生了什么事情,还能把草图直接转换成代码运行起来。 中国工程院院士倪光南也表示开源在推动全球信息技术发展方面起着很大作用。中国现在是全球最大的开源大模型提供者之一,像Qwen、DeepSeek、Kimi这些都排在前列。