半导体行业研究:推理算力需求持续增长,ASIC端侧应用前景广阔
请阅读最后评级说明和重要声明 分析师:吴起涤 执业登记编号:A0190523020001 wuqidi@yd.com.cn 分析师:赵毅轩 执业登记编号:A0190124060001 zhaoyixuan@yd.com.cn 上证指数与万德芯片概念指数走势 资料来源:Wind,源达信息证券研究所 -10.00%-5.00%0.00%5.00%10.00%15.00%20.00%上证指数与万德芯片概念指数走势上证指数万德芯片概念指数推理算力需求持续增长,ASIC 端侧应用前景广阔 半导体行业研究 证券研究报告/投资策略 投资要点 ➢ 推理算力需求扩容 近年来大模型持续迭代,大模型参数规模总体呈现增加趋势,参数增加带动算力需求扩容。ChatGPT 3.5加速了生成式人工智能的商业化进程,实现注册用户数量破亿仅耗时两个月,微软、谷歌等科技巨头纷纷接入,之后大模型热度持续火爆,带动算力需求激增。DeepseekR1问世推动大模型平价化,降低了大模型开发成本,利于为下游端侧和应用侧打开市场空间,下游爆发同样将催生大量算力需求,并推动算力需求由训练端向推理端转移。据IDC预测,推理服务器的工作负载占比预计由2020年的51.5%逐年增加至2026年的62.2%,中国人工智能服务器工作负载结构中的推理算力占比总体呈现增加趋势。 ➢ Deepseek推动大模型平价化,端侧,应用侧商业化进程有望提速 通过一系列算法优化,Deepseek-V3相较于同类模型,训练成本大幅下降,完成训练仅耗时不到两个月,按H800芯片算力测算, Deepseek-V3预训练阶段的训练时长为266,4万GPU小时,上下文扩展训练耗时11.9万GPU小时,后训练阶段耗时5,000 GPU小时,假设H800每小时的租赁价格为2美元,则模型的总训练成本为557.6万美元,训练成本仅为GPT-4o的十分之一。 ➢ ASIC适于端侧部署,市场空间广阔 本地推理不仅可以降低延时、提高吞吐量,摆脱网络限制,还有助于保护数据安全和用户隐私,终端推理任务的本地化运行或是未来的发展趋势,本地推理需求的增加将促进ASIC市场需求扩容。 ASIC芯片专门用来优化神经网络推理或者矩阵运算任务,专注于特定用途或特定模型,相较GPU在功耗、可靠性、性能、成本等方面具备优势,因此更适于在端侧和用户侧部署,如智驾、AI眼镜、智能家居等。随着大模型平价化,预期AI产品将在更多应用场景下实现商业落地,ASIC芯片具备广阔的市场前景。 ➢ 投资建议 建议关注产品矩阵丰富,下游应用领域覆盖全面的芯原股份和寒武纪。 ➢ 风险提示 建议关注技术迭代风险、下游需求不及预期的风险和中美贸易摩擦加剧的风险。 2 目录 一、应用场景有别,性能各有侧重 二、推理端算力需求扩容 .............................................................................................................. 4 1.参数数量总体呈现增加趋势 ......................................................................................................................... 4 2.大模型火热,用户量激增 ............................................................................................................................ 6 3. Deepseek 推动大模型平价化,利好端侧、应用侧爆发 ............................................................................. 6 三、终端定制化特点突出,看好 ASIC 芯片发展前景 ................................................................... 7 四、投资建议 ............................................................................................................................. 11 1、芯原股份 ................................................................................................................................................. 11 2、寒武纪 ..................................................................................................................................................... 11 五、风险提示 ............................................................................................................................. 12 图表目录 图 1:云端部署、边缘部署、终端部署 ......................................................................................................................... 3 图 2:训练与推理环节的性能需求不同 ......................................................................................................................... 3 图 3:中国人工智能服务器工作负载预测,2020-2026 ............................................................................................... 4 图 4:参数量与大模型性能 ........................................................................................................................................... 5 图 5:增长 1 亿用户花费时间 ................................
[源达信息]:半导体行业研究:推理算力需求持续增长,ASIC端侧应用前景广阔,点击即可下载。报告格式为PDF,大小1.05M,页数13页,欢迎下载。
