deepseek新模型曝光：100万上下文加多模态

DeepSeek把新模型拿出来曝光了，听说华为抢先拿到了访问权限，而英伟达和AMD就没这机会。李水青在2月26日发消息说，这两天AI圈里因为DeepSeek未发布的V4新模型闹翻了天。不少信源都说，DeepSeek V4 Lite这次的测试结果相比之前的V3.2版本有了质的飞跃，模型支持100万个上下文处理，还原生支持多模态功能。网上还流出了好几张首批生成的SVG示例图，大家传得特别火。现在这个模型已经发给华为这些芯片厂商去测试了。路透社也报道了，DeepSeek最近给华为等国内供应商提供了提前访问权，让他们帮忙优化处理器软件，让模型在硬件上跑得更快。Legit在X上爆料的DeepSeek V4 Lite最新消息，很快就有12万阅读量了。Legit提到V4 Lite正在紧张测试中，至少有一家推理公司拿到了权限，不过签了保密协议。这个代号叫sealion-lite的版本，上下文窗口长达100万个token，比Web和App模型好用多了。Fandu之前泄露的SVG示例也被传疯了。Fandu觉得DeepSeek这次是“强势回归”，说新模型代码更干净、质量更高。第一组SVG是围绕“骑自行车的鹈鹕”生成的，左图非思考模式的V4 Lite画得更像实物，互动也合理；右图思考模式的V3.2就画得四不像。第二组是Xbox 360手柄图，左图V4 Lite细节丰富符合功能设定；右图V3.2就太简陋了。好多网友都觉得非思考模式的V4 Lite比思考模式的V3.2还要强很多。有网友说：“100万上下文加多模态根本不是什么轻量级功能。‘轻量级’可能指运行成本低，但能力并不弱——它是成本优化的强产品。”还有人断言：“长上下文窗口的小参数模型意味着推理成本极低，这可能改变行业格局。”一位网友感叹：“上一个版本曾让英伟达一天蒸发6000亿美元市值。这次的V4 Lite SVG质量惊人，代码也更简洁。市场要迎接巨变了。”之前有传言说DeepSeek V4预计2026年2月中旬发布，会有耗时较长的编码版和响应更快的Lite版。还有人猜Lite版参数是2850亿。2月11日DeepSeek-V3.2做了个灰度升级，上下文长度直接从128K升到1M token，知识库也更新到了2025年5月。不少用户都催着要V4赶紧出来。一位海外网友说：“等不及了！我的Claude订阅3月4日就到期了，希望DeepSeek在那之前发布。”到目前为止DeepSeek还没出来回应这事。