deepseek的v4 版本最快下周就能见着了,现在细节是一点一点往外冒

咱们说个事儿,DeepSeek 的 V4 版本估计最快下周就能见着了,现在细节是一点一点地往外冒。科技账号 Legit 最先说了,它的那个轻量版叫「海狮轻量版」,已经给一家做推理的公司拿去内测了,大家都签了保密协议不让说。听爆料说这玩意儿能处理 100 万个词的上下文,还自带多模态能力,跑得比现在用的网页版和 APP 版快多了。 还有人给了个 SVG 的图片样例看,效果看着确实很亮眼。就在大家还在琢磨参数咋泄露的时候,路透社那边传出来的消息更吓人,说 DeepSeek 打算下周就把 V4 给发了。早几天南华早报也说过,这次升级应该是个万亿参数级别的大模型。因为模型太大了,训练起来比以前慢很多,所以这发布时间才拖到了现在。 路透社那篇文章还提到了个有趣的点,DeepSeek 发这 V4 之前,没按老规矩先给美国的英伟达和 AMD 看预览,反而先把华为这些中国的芯片厂给放行了好几个星期,让他们有时间去弄适配和优化。目前英伟达和 AMD 都没吭声,DeepSeek 和华为也没回复。 眼瞅着这周网友也发现 DeepSeek 的 GitHub 仓库特别忙乎,一堆积压的 PR 都在这两天被合并了。看这些更新主要是在跟 DeepSeek API 集成有关的代码库里动的手。内容涉及了 AI 客户端应用、开发运维工具和企业级解决方案这些第三方项目。这波操作感觉就像是工程师节后复工的例行清理工作。 你去 Hugging Face 上数数就能发现有七千多万次的下载量呢,说明 DeepSeek 在开源 AI 这块儿还是相当火的。大家都在等这只「海狮」到底啥时候正式出来露个面。