谷歌深度整合Lyria 3音乐生成技术全球布局数字音频新赛道

2026年2月21日，谷歌宣布音乐生成模型Lyria 3正式登陆Gemini应用和YouTube平台，面向全球18岁以上用户开放。这是该公司生成式音频领域最大规模的产品部署，显示其正在加速布局此新兴市场。 Lyria 3在技术上取得三项关键进展：能够自动生成与旋律匹配的歌词；支持用户精细调节节拍、人声等音乐元素；可接受文本、图片、视频等多种输入形式，根据素材生成相应情绪的音乐。目前功能已在桌面端陆续上线，移动端版本将后续推出。在版权保护上，谷歌采取了审慎措施。所有生成音频都嵌入SynthID数字水印，便于追踪来源。当用户指令涉及知名音乐人时，模型仅提取风格特征，不会复制具体艺术家的声音特质。这一设计基于谷歌与主要唱片公司的现有合作协议。此次发布的时机值得关注。当前生成式音频领域正面临版权争议，多家初创公司因训练数据问题被起诉。谷歌凭借与YouTube的版权合作基础，采取了相对稳健的推进策略。不过，Lyria 3也存在一定局限。业内分析指出，该模型在流行、R&B等主流风格上表现优异，但对小众风格的支持较弱。30秒的时长限制也表明其定位主要是满足短视频配乐需求，特别是YouTube Shorts的内容创作，而非专业音乐制作。从商业角度看，Lyria 3是谷歌构建创意工具生态的重要一步。通过将其整合至Gemini订阅服务，谷歌希望提供从文本、图像到音频的完整内容生产解决方案，增强产品竞争力。

音乐生成技术的兴起不仅改变了创作方式，更重塑了内容生产模式；在技术快速迭代的当下，如何在创新与规则之间找到平衡，将决定这个领域的发展前景。

谷歌深度整合Lyria 3音乐生成技术 全球布局数字音频新赛道

谷歌深度整合Lyria 3音乐生成技术全球布局数字音频新赛道