资讯科技行业AI音乐:打通技术新路径,大模型时代加速发展
本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。 证券研究报告·海外行业深度 AI 音乐:打通技术新路径,大模型时代加速发展 核心观点 计算机音乐因专业门槛相对高、结构化数据获取难度大,相比计算机视觉及自然语言处理发展较缓慢,随着大模型引发 AI 浪潮、硬件及基础设施快速升级,AI 音乐迎来机遇:2023 年 2 月谷歌推出 MusicLM 模型,尝试以 Bert 模型机制实现音乐数据的情景生成,结合早期基于 RNN、VAEs、GANs 的预训练模型,音色混音等难题得以攻克,上游数据标注领域也逐渐出现商业化工具。目前 AI 音乐发展的障碍在于核心版权资源高度分散,数字音乐行业版权壁垒高筑,原始录制文件无法从互联网直接获取,随着版权方投资入局,谷歌引领 wav-to-wav 类模型兴起,发展路径更加通畅,有望产生突破式进展。 硬件升级解锁新的技术路径,“暴力求解”模式解放 AI 音乐生产力。计算机音乐已经几十年发展历史,基于深度学习的音乐生成约在 2015 年起步,主流模型是 VAEs、GANs 等,行业玩家包括索尼等科技公司、Spotify 等流媒体平台、乐器厂商、AI 音乐初创公司等。2022 年以来大模型浪潮推动 AI 基础设施发展,谷歌尝试用 NLP 生成方式训练音乐生成模型,验证了 MLM 方式在音乐生成任务中的可行性(传统 AI 音乐模型的基础理论主要是概率类),音色、混音等难题得以一并攻克。随着算力持续升级、调优迭代、数据量增加,模型有巨大的升级潜力。 核心痛点是版权音乐资源的封闭和分散,随着版权方积极入局、上游数据集行业发展,现状有望改善。音乐版权壁垒高筑,版权资源有严格的层级分发渠道,三大唱片厂拥有大部分流行音乐版权。不同于图文,互联网获取的音频丢失了大量创作细节,难用于结构化的再生成,长期以来主流模型使用的是以 BGM、古典乐、游戏音乐为主的公版资源。近年来环球音乐、华纳音乐等老牌唱片公司积极投资 AI 音乐初创公司,有望释放更多商业 AI 数据资源;上游数据标注行业发展也将推动 wav to wav 模式下更多训练资源的产出,国内已经有慧听科技,海天瑞声等公司提供音乐数据服务,各众包平台也能提供定制化的标注服务。 公司方面,(1)版权方:包括环球音乐、华纳音乐、索尼音乐等,其中索尼音乐依托索尼集团,AI 研发和商业化能力领先。(2)流媒体平台:Spotify、TME、云音乐、Apple Music 等,研究主要围绕用户行为、歌曲识别等展开,长期有望受益于 AI 增量内容带来的全行业降本增效。(3)互联网公司:谷歌、微软、百度等,AI 研究成果储备最多,有望持续推动前沿技术革新。(4)AI 通用技术商和数据公司,比如商汤,科大讯飞,海天瑞声等。 维持 强于大市 孙晓磊 sunxiaolei@csc.com.cn SAC 编号:s1440519080005 SFC 编号:BOS358 崔世峰 cuishifeng@csc.com.cn SAC 编号:S1440521100004 发布日期: 2023 年 05 月 11 日 市场表现 相关研究报告 -30%-10%10%30%50%2022/4/182022/5/182022/6/182022/7/182022/8/182022/9/182022/10/182022/11/182022/12/182023/1/182023/2/182023/3/18传媒恒生指数资讯科技业 仅供内部参考,请勿外传 海外行业深度报告 资讯科技业 请参阅最后一页的重要声明 目录 一、生产要素分析 ................................................................................................................................................... 1 技术路线:百花齐放,算力升级使暴力求解成为可能................................................................................ 1 (1)传统路线:基于音符逻辑的算法音乐.......................................................................................... 1 (2)AI 时代:神经网络架构的音乐生成诞生多流派 ........................................................................ 1 (3)GoogleMusicLM:基于 NLP 语境学习思路的音乐生成 ............................................................ 5 数据集:版权标注曲库是核心稀缺资源 ....................................................................................................... 7 二、公司动态 .......................................................................................................................................................... 11 版权方&流媒体&互联网公司 ................................................................................................................ 11 商业化成品对比 ..................................................................................................................................... 14 风险分析 ................................................................................................................................................................. 17 图表目录 图 1: AI 音乐产业细分 .........................................................
[中信建投]:资讯科技行业AI音乐:打通技术新路径,大模型时代加速发展,点击即可下载。报告格式为PDF,大小1.84M,页数21页,欢迎下载。
