计算机行业周报:DeepSeek-V3模型发布,AI军备竞赛持续
本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。 1 2024 年 12 月 30 日 计算机 行业周报 DeepSeek-V3 模型发布,AI 军备竞赛持续 证券研究报告 投资评级 领先大市-A 维持评级 首选股票 目标价(元) 评级 行业表现 资料来源:Wind 资讯 升幅% 1M 3M 12M 相对收益 -1.3 26.3 0.0 绝对收益 0.6 33.8 19.3 赵阳 分析师 SAC 执业证书编号:S1450522040001 zhaoyang1@essence.com.cn 夏瀛韬 分析师 SAC 执业证书编号:S1450521120006 xiayt@essence.com.cn 相关报告 豆包大模型全面升级,关注字节产业链投资机会 2024-12-23 Palantir 由大数据到 AI,国内企业如何布局? 2024-12-16 OpenAI 新品陆续发布,AI应用迎持续催化 2024-12-09 科技创新打头阵,奋力一搏正当时——2025 年计算机行业年度策略 2024-12-02 运力释放叠加应用加速,卫星互联网迎密集催化 2024-12-01 DeepSeek-V3 模型发布,极致性价比打破算力制约 2024 年 12 月 26 日,幻方量化旗下的公司深度求索(DeepSeek)发布 DeepSeek-V3 版本大模型。根据官方的技术报告披露,DeepSeek-V3模型采用 MoE 架构,参数量达到 671B,具备极致的性价比: 1)经济效益凸显,打破算力制约:根据技术报告披露,DeepSeek-V3在预训练阶段,在每万亿 tokens 上训练仅需 18 万 H800 GPU hour,即拥有 2048 个 H800 GPU 的集群上仅需 3.7 天。因此,预训练阶段在不到两个月的时间内完成,耗时 266.4 万 GPU hour。结合 11.9 万GPU hour 的上下文长度扩展和 5000 GPU hour 的后训练,DeepSeek-V3的完整训练仅需 278.8 万 GPU hour。技术文档假设 H800 GPU 的租用价格为每 GPU hour 2 美元,该模型的总训练成本仅为 557.6 万美元。这一训练成本大大低于其他的海外模型如 Llama-3.1、GPT-4o、Claude-3.5 等,具有非常强的经济性。 2)极致性价比,成本下降同时能力提升:根据技术报告披露,DeepSeek-V3 率先采用了无辅助损失的负载均衡策略,最大限度地减少了因鼓励负载均衡而导致的性能下降。在预训练阶段,模型设计了一个 FP8 混合精度训练框架,通过算法、框架和硬件的协同设计,克服了跨节点 MoE 训练中的通信瓶颈,实现了近乎完全的计算通信重叠。这显著提高了训练效率并降低了训练成本。在后训练阶段,将推理能力从 DeepSeek R1 系列中的模型提取到 DeepSeek-V3 中。DeepSeek-V3 的多项评测成绩超越 Qwen2.5-72B 和 Llama-3.1-405B等其他开源模型,并在性能上和头部的闭源模型 GPT-4o 以及Claude-3.5-Sonne。 利好国产算力和国内 AI 应用。我们认为 DeepSeek-V3 的发布,表明在有限算力的情况下,可以实现较好的模型能力,利好国产算力需求的提升,以及加速国内 AI 应用的发展,关注国产算力:寒武纪、海光信息、中科曙光、神州数码、浪潮信息等;国内 AI 应用:鼎捷数智、汉得信息、金山办公、科大讯飞、迈富时、佳发教育、万兴科技、美图公司等。 小米加大 AI 模型投入,军备竞赛持续 2024 年 12 月 26 日,根据财联社报告,小米正在着手搭建自己的 GPU万卡集群,将对 AI 大模型大力投入。我们认为小米入局表明 AI 军备竞赛持续,一方面利好算力投入,另一方面 AI 手机、智能驾驶、AI可穿戴设备等端侧 AI 或将成为小米重点布局的领域,建议关注相应投资机会。 风险提示: 1)宏观经济变化影响企业信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。 -31%-21%-11%-1%9%19%29%39%2024-012024-052024-082024-12计算机沪深300行业周报/计算机 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。 2 内容目录 1. 本周行业观点 ............................................................... 3 2. 市场行情回顾 ............................................................... 4 2.1. 本周板块指数涨跌幅 ................................................... 4 2.2. 本周计算机个股表现 ................................................... 5 图表目录 图 1. 本周各行业涨跌幅统计 .................................................... 5 表 1: 本周 A 股市场指数涨跌幅统计 ............................................. 4 表 2: 本周海外市场指数涨跌幅统计 ............................................. 4 表 3: 本周计算机个股涨跌幅统计 ............................................... 5 行业周报/计算机 本报告版权属于国投证券股份有限公司,各项声明请参见报告尾页。 3 1.本周行业观点 DeepSeek-V3 模型发布,极致性价比打破算力制约 2024 年 12 月 26 日,幻方量化旗下的公司深度求索(DeepSeek)发布 DeepSeek-V3 版本大模型。根据官方的技术报告披露,DeepSeek-V3 模型采用 MoE 架构,参数量达到 671B,具备极致的性价比: 1)经济效益凸显,打破算力制约:根据技术报告披露,DeepSeek-V3 在预训练阶段,在每万亿 tokens 上训练仅需 18 万 H800 GPU hour,即拥有 2048 个 H800 GPU 的集群上仅需 3.7 天。因此,预训练阶段在不到两个月的时间内完成,耗时 266.4 万 GPU hour。结合 11.9 万 GPU hour的上下文长度扩展和 5000 GPU h
[国投证券]:计算机行业周报:DeepSeek-V3模型发布,AI军备竞赛持续,点击即可下载。报告格式为PDF,大小1.13M,页数7页,欢迎下载。
