有了AI、API和Agent,端云协同给行业带来了大变化,把入口重塑还有硬件的玩法都给翻了个个儿。大家都在看这个趋势,也盯着里面的机会跟风险。这报告是东吴证券搞的。在云端模型变得更强的背景下,端侧也在优化效率,说白了就是分工更明确。端侧负责处理那些高频、轻量的活,重算力的任务还是得上云。多模态能力提升和算法优化是端侧的两大方向。多模态是实时交互的关键,全双工流式架构成了主流。视觉Token压缩技术能缓解算力带宽的瓶颈。算法侧通过EdgeMoE优化了MoE架构来适配端侧,4-bit量化成了标配,更低精度的技术也在探索。Attention效率、KV Cache管理、并行解码这些方面也都在优化。端侧模型的升级直接带动硬件体系重构。三星LPDDR6传输速率和带宽提升了,能效还优化了21%。Exynos 2600芯片引入新材料降低了热阻。高通下一代旗舰SoC也会在算力、存储和散热方面同步升级。 报告指出春节期间国内厂商大模型更新特别密集,性能接近海外水平,价格也便宜了不少。智谱GLM-5、字节豆包2.0这些模型对标海外第一梯队但定价有优势。成本降下来激活了应用需求,多Agent部署从验证走向规模落地了。大家竞争的重点也变成了多模态体验跟整合能力的较量。这就意味着整机AI功能从简单的图像消除变成多模态创作还有系统级深度整合。 SoC、GLM、GLM-5、KV、LPDDR、LPDDR6、MoE这些词都在里面出现了。免责声明也是要说一下:尊重知识产权和数据隐私,内容是从网上收集整理的版权归原机构所有。如果侵权联系我们删了就好。