deepseek的v4 版本最快下周就能见着了，现在细节是一点一点往外冒

咱们说个事儿，DeepSeek 的 V4 版本估计最快下周就能见着了，现在细节是一点一点地往外冒。科技账号 Legit 最先说了，它的那个轻量版叫「海狮轻量版」，已经给一家做推理的公司拿去内测了，大家都签了保密协议不让说。听爆料说这玩意儿能处理 100 万个词的上下文，还自带多模态能力，跑得比现在用的网页版和 APP 版快多了。还有人给了个 SVG 的图片样例看，效果看着确实很亮眼。就在大家还在琢磨参数咋泄露的时候，路透社那边传出来的消息更吓人，说 DeepSeek 打算下周就把 V4 给发了。早几天南华早报也说过，这次升级应该是个万亿参数级别的大模型。因为模型太大了，训练起来比以前慢很多，所以这发布时间才拖到了现在。路透社那篇文章还提到了个有趣的点，DeepSeek 发这 V4 之前，没按老规矩先给美国的英伟达和 AMD 看预览，反而先把华为这些中国的芯片厂给放行了好几个星期，让他们有时间去弄适配和优化。目前英伟达和 AMD 都没吭声，DeepSeek 和华为也没回复。眼瞅着这周网友也发现 DeepSeek 的 GitHub 仓库特别忙乎，一堆积压的 PR 都在这两天被合并了。看这些更新主要是在跟 DeepSeek API 集成有关的代码库里动的手。内容涉及了 AI 客户端应用、开发运维工具和企业级解决方案这些第三方项目。这波操作感觉就像是工程师节后复工的例行清理工作。你去 Hugging Face 上数数就能发现有七千多万次的下载量呢，说明 DeepSeek 在开源 AI 这块儿还是相当火的。大家都在等这只「海狮」到底啥时候正式出来露个面。