deepseek新模型曝光:100万上下文加多模态

DeepSeek把新模型拿出来曝光了,听说华为抢先拿到了访问权限,而英伟达和AMD就没这机会。李水青在2月26日发消息说,这两天AI圈里因为DeepSeek未发布的V4新模型闹翻了天。不少信源都说,DeepSeek V4 Lite这次的测试结果相比之前的V3.2版本有了质的飞跃,模型支持100万个上下文处理,还原生支持多模态功能。网上还流出了好几张首批生成的SVG示例图,大家传得特别火。现在这个模型已经发给华为这些芯片厂商去测试了。路透社也报道了,DeepSeek最近给华为等国内供应商提供了提前访问权,让他们帮忙优化处理器软件,让模型在硬件上跑得更快。Legit在X上爆料的DeepSeek V4 Lite最新消息,很快就有12万阅读量了。Legit提到V4 Lite正在紧张测试中,至少有一家推理公司拿到了权限,不过签了保密协议。这个代号叫sealion-lite的版本,上下文窗口长达100万个token,比Web和App模型好用多了。Fandu之前泄露的SVG示例也被传疯了。Fandu觉得DeepSeek这次是“强势回归”,说新模型代码更干净、质量更高。第一组SVG是围绕“骑自行车的鹈鹕”生成的,左图非思考模式的V4 Lite画得更像实物,互动也合理;右图思考模式的V3.2就画得四不像。第二组是Xbox 360手柄图,左图V4 Lite细节丰富符合功能设定;右图V3.2就太简陋了。好多网友都觉得非思考模式的V4 Lite比思考模式的V3.2还要强很多。有网友说:“100万上下文加多模态根本不是什么轻量级功能。‘轻量级’可能指运行成本低,但能力并不弱——它是成本优化的强产品。”还有人断言:“长上下文窗口的小参数模型意味着推理成本极低,这可能改变行业格局。”一位网友感叹:“上一个版本曾让英伟达一天蒸发6000亿美元市值。这次的V4 Lite SVG质量惊人,代码也更简洁。市场要迎接巨变了。”之前有传言说DeepSeek V4预计2026年2月中旬发布,会有耗时较长的编码版和响应更快的Lite版。还有人猜Lite版参数是2850亿。2月11日DeepSeek-V3.2做了个灰度升级,上下文长度直接从128K升到1M token,知识库也更新到了2025年5月。不少用户都催着要V4赶紧出来。一位海外网友说:“等不及了!我的Claude订阅3月4日就到期了,希望DeepSeek在那之前发布。”到目前为止DeepSeek还没出来回应这事。