谷歌 DeepMind 于2026 年 2 月 18 日正式发布最新一代 AI 音乐生成模型Lyria 3,并已集成至Gemini 应用开启全球公测,主打零门槛、多模态、自动歌词 + 高保真 30 秒音乐生成。
一、核心定位与发布
- 定位:DeepMind 迄今最先进的音乐生成模型,核心是降低创作门槛,让普通人用自然语言 / 图片 / 视频快速生成完整歌曲。
- 入口:直接内置在Gemini 桌面端(已上线)与移动端(后续推送),无需额外软件。
- 开放范围:全球 18 岁以上用户,支持8 种语言(英、德、西、法、印地、日、韩、葡),非商用免费。
- 生态联动:同步接入YouTube Dream Track,为 Shorts 短视频创作者提供背景音乐。
二、三大核心升级(对比 Lyria 2)
- 自动生成完整歌词不再需要用户提供歌词,模型可根据提示词直接创作匹配主题、风格的歌词与人声。
- 多模态输入 + 精细控制
- 输入方式:文本描述、上传照片(分析画面氛围配乐)、上传视频(匹配节奏做 BGM)。
- 创作控制:可指定曲风、人声类型、节奏、乐器、情绪,生成后还能微调(如 “放慢速度”“加弦乐”)。
- 音质与结构大幅提升
- 输出:30 秒高保真音轨,含人声 + 歌词 + 完整伴奏,48kHz 立体声、24-bit 位深。
- 效果:乐器层次、人声真实度、音乐结构复杂度接近专业制作水准。
- 配套:每首歌自动生成Nano Banana 模型定制封面,可下载 MP3/MP4(含封面)。
三、技术与合规要点
- 训练数据:超200 万首曲目,严格遵循版权协议。
- 版权防护:内置SynthID 数字水印,可溯源 AI 生成内容;提供音频鉴别功能,可检测是否为谷歌 AI 生成。
- 使用限制:当前仅生成30 秒片段,仅限非商业用途。
四、典型使用场景
- 个人创作:一句话生成歌曲(如 “90 年代复古说唱,讲袜子找配对的搞笑爱情”)。
- 短视频配乐:上传视频,自动生成贴合节奏与情绪的 BGM。
- 灵感配乐:上传风景 / 宠物照片,生成氛围匹配的音乐。
