计算机行业:DeepSeek冲击全球AI产业格局,看好国产算力与AI应用

DeepSeek冲击全球AI产业格局,看好国产算力与AI应用分析师:李杰登记编号:S05005210700012025年02月24日证券研究报告 增持(维持)目 录一、DeepSeek的算法工程创新二、DeepSeek冲击全球AI产业格局三、看好算力与应用环节2四、投资建议与风险提示一、DeepSeek的算法工程创新3◼ 幻方量化拥有近10年的二级市场量化交易经验,是国内罕见的使用大模型做量化交易的公司;◼ 2021年已投资10亿元配置了超过1万张英伟达A100;◼ 2023年5月,AI团队独立,成立DeepSeek,2023年11月,推出了首个开源通用大语言模型DeepSeek LLM,2024年5月,推出了DeepSeek V2,使用了MOE架构,并在架构层面进行了创新,从而大幅提高了推理效率,成本大幅降低,在国内引发价格战。4图 1 DeepSeek发展历程资料来源:运营在观察、湘财证券研究所◼ DeepSeek V3论文中提到的550美元成本,是指训练成本,不包括前期实验成本、薪资支出以及服务器购置等成本,与之相比,Claude 3.5 Sonnet的训练成本为几千万美元;◼ 根据SemiAnalysis的分析,DeepSeek的总服务器成本为16.29亿美元/年,总支出为25.73亿美元/年。5图2 DeepSeek总成本估计资料来源:SemiAnalysis、湘财证券研究所◼ 得益于训练成本的大幅下降,以及算法的优化,DeepSeek的推理成本也大幅下降;◼ DeepSeek的推理价格大约是GPT-4o的1/30。6图3 DeepSeek与竞品对比资料来源:SemiAnalysis、湘财证券研究所◼ DeepSeek在算法工程方面作出了大量创新,这些创新大幅降低了训练成本,并取得了优异的训练效果。7技术理论的提出方哪些企业在大规模实践MoE (混合专家模型)架构1991年首次被麻省理工大学、多伦多大学雅各布斯、诺兰、辛顿三位学者在论文《本地专家的自适应混合》(《Adaptive mixtures of local experts》)中提出。2017年谷歌在Transformer模型中最早引入MoE层2023年法国Al创业公司Mistral Al最早大规模开源MoE模型。2024年5月DeepSeek发布V2时较早使用了MoE架构。字节跳动的豆包2024年6月大规模部署MoE模型,阿里的通义2024年3月发布小参数MoE 模型,2025年1月发布大参数MoE模型Qwen2.5-MaxMLA (多头潜在注意力)机制DeepSeek 2024年5月最先在DeepSeek-V2发布的论文中提出。该注意力机制在MHA(Multi-Head Attention)多头注意力机制的基础上进行优化创新。目前仅有DeepSeek在V2 /V3两款模型中大规模使用了这一技术FP8(8位浮点数)混合精度训练2022年首次被英伟达、Arm 和英特尔联合提出,它们共同发表了论文《深度学习的FP8 格式》(《FP8 Formats for Deep Leaming》) 。2023 年微软曾开发开源的FP8-LM FP8混合精度框架2022年-2023年,亚马逊AWS、微软Azure、 谷歌云均支持FP8数据格式的模型训练。但由于美国科技公司普遍不缺算力,且FP8训练会增加训练的复杂度,因此这一技术并未被深入探索。传统上,大模型训练使用32位浮点数(FP32)格式来做计算和存储,这能保证精度,但计算速度慢、存储空间占用大。DeepSeek则构建了FP8 混合精度训练框架,根据不同的计算任务和数据特点,动态选择FP8或 FP32 精度来进行计算,把训练速度提高了50%,内存占用降低了40%强化学习训练1961年首次被普林斯顿大学明斯基(Marvin Minsky)在论文《迈向人工智能的步骤》《Steps Toward Artificial Intelligence》提出。OpenAI 2024年9月发布o1模型时使用了这一技术强化学习技术在大型科技公司的日常业务中被大规模使用。强化学习训练模型的做法,谷歌DeepMind、OpenAl o1进 行了阐释。2024年下半年之后,业内普遍认为,大模型性能提升的重要技术方向是强化学习。DeepSeek更上层楼,推出新的强化学习算法GRPO( Group Relative Policy Optimization 组相对策略优化),在显著降低计算成本的同时,还提高了模型的训练效率图4 DeepSeek的主要创新点资料来源:财经、湘财证券研究所二、DeepSeek冲击全球AI产业格局8◼ 促使海外厂商反思传统的AI发展路径,开始重视算法的优化;◼ 崛起为全球主要AI玩家之一。9图5 DeepSeek的亮点资料来源:峰瑞资本、湘财证券研究所◼ DeepSeek几乎将其所有研究成果都直接开源,打破了OpenAI o1系列模型的垄断地位,后续开源模型有望超越闭源模型引领行业发展;◼ DeepSeek让中国AI产业摆脱了追随者的角色,成为AI创新玩家,提升了国内AI产业甚至科技产业的信心。10图6 大模型排名榜单资料来源:财经、湘财证券研究所三、看好算力与应用环节11◼ 大量应用需求云厂商资源利用率提升;◼ DeepSeek降低了算力卡门槛;◼ 阿里巴巴称,未来三年,集团在云和AI基础设施投入预期将超越过去10年总和;◼ 看好国产算力需求,包括昇腾系服务器制造、国产算力芯片、液冷、超级电容、存储等需求。12图7 服务器产业链资料来源:富果研究部、湘财证券研究所◼ DeepSeek降低了大模型训练门槛以及推理调用价格,有望推动优质AI应用的繁荣;◼ DeepSeek降低了端侧小模型部署门槛,有望推动端侧AI应用发展。13图8 iMA界面资料来源:腾讯、湘财证券研究所四、投资建议与风险提示1415➢投资建议:DeepSeek降低了算力卡门槛,阿里巴巴有望引领国内新一轮AI算力资本开支周期;DeepSeek降低了大模型训练门槛以及推理调用价格,有望推动优质AI应用的繁荣;DeepSeek降低了端侧小模型部署门槛,有望推动端侧AI应用发展。我们建议关注AI算力和AI应用,给予电子行业“增持”评级。➢风险提示:AI算力资本开支不及预期;AI应用开发不及预期。湘财证券投资评级体系(市场比较基准为沪深300 指数)重要声明湘财证券股份有限公司经中国证券监督管理委员会核准,取得证券投资咨询业务许可。本研究报告仅供湘财证券股份有限公司的客户使用。本公司不会因接收人收到本报告而视其为客户。本报告由湘财证券股份有限公司研究所编写,以合法地获得尽可能可靠、准确、完整的信息为基础,但对上述信息的来源、准确性及完整性不作任何保证。湘财证券研究所将随时补充、修订或更新有关信息,但未必发布。在任何情况下,报告中的信息或所表达的意见仅供参考,并不构成所述证券买卖的出价或征价,投资者应自主作出投资决策并自行承担投资风险,任何形式的分享证券投资收益或者分担证券投资损失书面或口头承诺均为无效。本公司及其关联机构、雇员对使用本报告及其内容所引发的任何直接或间接损失概不负责。投资者应明白并理解投资证券及投资产

立即下载
电子设备
2025-03-03
湘财证券
16页
1.3M
收藏
分享

[湘财证券]:计算机行业:DeepSeek冲击全球AI产业格局,看好国产算力与AI应用,点击即可下载。报告格式为PDF,大小1.3M,页数16页,欢迎下载。

本报告共16页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共16页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
中国台式机月度销量及增速 图表11:中国笔电月度销量及增速
电子设备
2025-03-03
来源:AI周观察:Blackwell全面投产但拖累毛利率,海外前沿新模型发布
查看原文
2025 年 1 月中国智能手机销量前十
电子设备
2025-03-03
来源:AI周观察:Blackwell全面投产但拖累毛利率,海外前沿新模型发布
查看原文
中国智能手机销量(台)
电子设备
2025-03-03
来源:AI周观察:Blackwell全面投产但拖累毛利率,海外前沿新模型发布
查看原文
视频生成类 AI 应用活跃度
电子设备
2025-03-03
来源:AI周观察:Blackwell全面投产但拖累毛利率,海外前沿新模型发布
查看原文
聊天助手类 AI 应用活跃度
电子设备
2025-03-03
来源:AI周观察:Blackwell全面投产但拖累毛利率,海外前沿新模型发布
查看原文
本周海外 AI 相关个股行情
电子设备
2025-03-03
来源:AI周观察:Blackwell全面投产但拖累毛利率,海外前沿新模型发布
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起