计算机行业周报：DeepSeek-V3模型发布，AI军备竞赛持续

本报告版权属于国投证券股份有限公司，各项声明请参见报告尾页。 1 2024 年 12 月 30 日计算机行业周报 DeepSeek-V3 模型发布，AI 军备竞赛持续证券研究报告投资评级领先大市-A 维持评级首选股票目标价（元）评级行业表现资料来源：Wind 资讯升幅% 1M 3M 12M 相对收益 -1.3 26.3 0.0 绝对收益 0.6 33.8 19.3 赵阳分析师 SAC 执业证书编号：S1450522040001 zhaoyang1@essence.com.cn 夏瀛韬分析师 SAC 执业证书编号：S1450521120006 xiayt@essence.com.cn 相关报告豆包大模型全面升级，关注字节产业链投资机会 2024-12-23 Palantir 由大数据到 AI，国内企业如何布局？ 2024-12-16 OpenAI 新品陆续发布，AI应用迎持续催化 2024-12-09 科技创新打头阵，奋力一搏正当时——2025 年计算机行业年度策略 2024-12-02 运力释放叠加应用加速，卫星互联网迎密集催化 2024-12-01 DeepSeek-V3 模型发布，极致性价比打破算力制约 2024 年 12 月 26 日，幻方量化旗下的公司深度求索（DeepSeek）发布 DeepSeek-V3 版本大模型。根据官方的技术报告披露，DeepSeek-V3模型采用 MoE 架构，参数量达到 671B，具备极致的性价比： 1）经济效益凸显，打破算力制约：根据技术报告披露，DeepSeek-V3在预训练阶段，在每万亿 tokens 上训练仅需 18 万 H800 GPU hour，即拥有 2048 个 H800 GPU 的集群上仅需 3.7 天。因此，预训练阶段在不到两个月的时间内完成，耗时 266.4 万 GPU hour。结合 11.9 万GPU hour 的上下文长度扩展和 5000 GPU hour 的后训练，DeepSeek-V3的完整训练仅需 278.8 万 GPU hour。技术文档假设 H800 GPU 的租用价格为每 GPU hour 2 美元，该模型的总训练成本仅为 557.6 万美元。这一训练成本大大低于其他的海外模型如 Llama-3.1、GPT-4o、Claude-3.5 等，具有非常强的经济性。 2）极致性价比，成本下降同时能力提升：根据技术报告披露，DeepSeek-V3 率先采用了无辅助损失的负载均衡策略，最大限度地减少了因鼓励负载均衡而导致的性能下降。在预训练阶段，模型设计了一个 FP8 混合精度训练框架，通过算法、框架和硬件的协同设计，克服了跨节点 MoE 训练中的通信瓶颈，实现了近乎完全的计算通信重叠。这显著提高了训练效率并降低了训练成本。在后训练阶段，将推理能力从 DeepSeek R1 系列中的模型提取到 DeepSeek-V3 中。DeepSeek-V3 的多项评测成绩超越 Qwen2.5-72B 和 Llama-3.1-405B等其他开源模型，并在性能上和头部的闭源模型 GPT-4o 以及Claude-3.5-Sonne。利好国产算力和国内 AI 应用。我们认为 DeepSeek-V3 的发布，表明在有限算力的情况下，可以实现较好的模型能力，利好国产算力需求的提升，以及加速国内 AI 应用的发展，关注国产算力：寒武纪、海光信息、中科曙光、神州数码、浪潮信息等；国内 AI 应用：鼎捷数智、汉得信息、金山办公、科大讯飞、迈富时、佳发教育、万兴科技、美图公司等。小米加大 AI 模型投入，军备竞赛持续 2024 年 12 月 26 日，根据财联社报告，小米正在着手搭建自己的 GPU万卡集群，将对 AI 大模型大力投入。我们认为小米入局表明 AI 军备竞赛持续，一方面利好算力投入，另一方面 AI 手机、智能驾驶、AI可穿戴设备等端侧 AI 或将成为小米重点布局的领域，建议关注相应投资机会。风险提示： 1）宏观经济变化影响企业信息化支出；2）财政与货币政策低于预期；3）供应链波动加大，影响科技产业发展。 -31%-21%-11%-1%9%19%29%39%2024-012024-052024-082024-12计算机沪深300行业周报/计算机本报告版权属于国投证券股份有限公司，各项声明请参见报告尾页。 2 内容目录 1. 本周行业观点 ............................................................... 3 2. 市场行情回顾 ............................................................... 4 2.1. 本周板块指数涨跌幅 ................................................... 4 2.2. 本周计算机个股表现 ................................................... 5 图表目录图 1. 本周各行业涨跌幅统计 .................................................... 5 表 1：本周 A 股市场指数涨跌幅统计 ............................................. 4 表 2：本周海外市场指数涨跌幅统计 ............................................. 4 表 3：本周计算机个股涨跌幅统计 ............................................... 5 行业周报/计算机本报告版权属于国投证券股份有限公司，各项声明请参见报告尾页。 3 1.本周行业观点 DeepSeek-V3 模型发布，极致性价比打破算力制约 2024 年 12 月 26 日，幻方量化旗下的公司深度求索（DeepSeek）发布 DeepSeek-V3 版本大模型。根据官方的技术报告披露，DeepSeek-V3 模型采用 MoE 架构，参数量达到 671B，具备极致的性价比： 1）经济效益凸显，打破算力制约：根据技术报告披露，DeepSeek-V3 在预训练阶段，在每万亿 tokens 上训练仅需 18 万 H800 GPU hour，即拥有 2048 个 H800 GPU 的集群上仅需 3.7 天。因此，预训练阶段在不到两个月的时间内完成，耗时 266.4 万 GPU hour。结合 11.9 万 GPU hour的上下文长度扩展和 5000 GPU h

立即下载

电子设备

2024-12-30

国投证券

7页

1.13M

[国投证券]:计算机行业周报：DeepSeek-V3模型发布，AI军备竞赛持续，点击即可下载。报告格式为PDF，大小1.13M，页数7页，欢迎下载。

本报告共7页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共7页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

计算机行业周报：DeepSeek-V3模型发布，AI军备竞赛持续

关于我们

联系我们

计算机行业周报：DeepSeek-V3模型发布，AI军备竞赛持续

关于我们

联系我们

小程序

公众号