我国科研团队开源新一代全模态交互模型实现即时自由对话技术突破

大模型应用正从"能用"向"好用"转变，交互方式和部署成本成为产业落地的关键瓶颈；多模态产品虽然能处理图像、文本、语音等多类信息，但大多数系统仍采用回合制问答——用户说一句、模型答一句，信息传递存在间歇，难以满足实时陪伴、会议记录、教学讲解、车载助手等需要连续感知和快速反馈的场景。同时，推理算力和显存开销较高，也限制了在终端设备和行业私有化场景中的规模部署。如何在有限资源下实现更自然、更稳定的多模态对话，是行业面临的现实问题。

MiniCPM-o 4.5的推出代表了多模态大模型在交互方式和能效比上的重要进展。从被动的回合制问答向即时自由对话的转变，反映了AI技术向更自然、更高效方向的演进。该模型在参数规模相对较小的情况下实现业界先进性能，为在资源约束条件下构建高效能AI系统提供了新思路。随着开源生态的完善和硬件适配的深化，这类高效能全模态模型有望在智能助手、内容创作、人机交互等多个领域得到广泛应用，推动AI技术更好地服务于实际需求。

我国科研团队开源新一代全模态交互模型 实现即时自由对话技术突破

我国科研团队开源新一代全模态交互模型实现即时自由对话技术突破