2026年2月21日,谷歌宣布音乐生成模型Lyria 3正式登陆Gemini应用和YouTube平台,面向全球18岁以上用户开放。这是该公司生成式音频领域最大规模的产品部署,显示其正在加速布局此新兴市场。 Lyria 3在技术上取得三项关键进展:能够自动生成与旋律匹配的歌词;支持用户精细调节节拍、人声等音乐元素;可接受文本、图片、视频等多种输入形式,根据素材生成相应情绪的音乐。目前功能已在桌面端陆续上线,移动端版本将后续推出。 在版权保护上,谷歌采取了审慎措施。所有生成音频都嵌入SynthID数字水印,便于追踪来源。当用户指令涉及知名音乐人时,模型仅提取风格特征,不会复制具体艺术家的声音特质。这一设计基于谷歌与主要唱片公司的现有合作协议。 此次发布的时机值得关注。当前生成式音频领域正面临版权争议,多家初创公司因训练数据问题被起诉。谷歌凭借与YouTube的版权合作基础,采取了相对稳健的推进策略。 不过,Lyria 3也存在一定局限。业内分析指出,该模型在流行、R&B等主流风格上表现优异,但对小众风格的支持较弱。30秒的时长限制也表明其定位主要是满足短视频配乐需求,特别是YouTube Shorts的内容创作,而非专业音乐制作。 从商业角度看,Lyria 3是谷歌构建创意工具生态的重要一步。通过将其整合至Gemini订阅服务,谷歌希望提供从文本、图像到音频的完整内容生产解决方案,增强产品竞争力。
音乐生成技术的兴起不仅改变了创作方式,更重塑了内容生产模式;在技术快速迭代的当下,如何在创新与规则之间找到平衡,将决定这个领域的发展前景。