机械设备行业:高端制造产业跟踪(1月):DeepSeek爆火预示着投资方向的何种变化?

DeepSeek爆火预示着投资方向的何种变化?高端制造产业跟踪(1月):证券研究报告 | 行业周报 2025/02/07机械设备行业投资评级看好分析师:祁岩登记编码:S0950523090001邮箱: qiyan1@wkzq.com.cn电话:010-56307033五矿证券研究所 高端制造行业联系人:周越邮箱: zhouyue@wkzq.com.cn联系人:张雪邮箱: zhangxue1@wkzq.com.cn板块观点01数据跟踪行情回顾新闻&公告Contents目录030204板块观点珍惜有限 创造无限DeepSeek系列为什么爆火?•DeepSeek实现行业领先模型能力,并且对代码开源。在AIME2024、Codeforces、GPQA Diamond、Math-500、MMLU等多个测试中,DeepSeek-R1展现出媲美OpenAI-o1的模型能力。•DeepSeek的模型成本大幅下降。在成本方面,DeepSeek-R1的API服务输出定价为16元/1M Tokens,相较于openAI-o1下降96%。对2024年12月发布的DeepSeek-V3,其API服务输出订单仅为8元(活动优惠期内为2元)/1M Tokens。1. 板块观点4图表1:DeepSeek-R1性能比肩OpenAI o1资料来源:DeepSeek,五矿证券研究所图表2:DeepSeek-R1的价格远低于OpenAI o1资料来源:DeepSeek,五矿证券研究所4珍惜有限 创造无限DeepSeek系列有哪些关键的技术突破?•DeepSeek系列模型有2个核心的模型,DeepSeek V3和DeepSeek R1/R1-zero。•DeepSeek V3在传统专家混合模型(MoE)上改进,实现了超低的训练成本。传统MoE模型存在负载均衡问题,在低精度训练方面也容易受到异常值影响。DeepSeek V3通过动态调整专家负载,避免了传统方案的性能损失,并且通过FP8混合精度训练框架验证了FP8在超大规模模型上的可行性。通过优化算法、框架和硬件协同,DeepSeek V3的训练需要180K H800 GPU hours(2048块H800上训练50-60天),训练成本仅557.6万美元。相比之下,OpenAI训练GPT-4使用了2万块A100显卡训练90-100天,训练成本约6300万美元。•DeepSeek R1/R1-zero通过大规模强化学习训练,涌现出强大推理能力。DeepSeek R1/R1-zero都是是通过大规模强化学习训练而来的模型,其中R1-zero没有将有监督微调(supervisedfine-tuning ,SFT)作为初始步骤。最早采用强化学习方法进行训练的模型是OpenAI o1。OpenAI研究科学家、o1核心贡献者Hyung Won Chung 在MIT进行过一次名为“Don’t teach. Incentivize(不要教,要激励)”的演讲,就论述了这一理念。 Hyung WonChung 认为AI领域正处于一次范式转变,即从传统的直接教授技能转向激励模型自我学习和发展通用技能。AGI所需要的技能太多,我们无法列举出每一项技能去teach,因此唯一可行的方法就是incentivize激励,让模型自己的思考、去涌现新的能力。在训练中,R1/R1-zero的推理能力通过强化学习自然涌现,思考时间随着模型的进行持续提升,自然而然地获得了解决越来越复杂推理任务的能力。•相比R1,R1-zero省略了监督有监督微调SFT环节,完全依赖于强化学习,进一步减少了人工干预,引起了更多的关注。这对于那些难以获取大量高质量标注数据的领域来说,具有重要的意义。1. 板块观点5珍惜有限 创造无限DeepSeek系列的影响?开源VS闭源大模型领域一直存在开源和闭源的争议。OpenAI的GPT系列是闭源模型的代表,而开源模型阵营则有meta的Llama模型。在国内,华为、百度选了闭源,而阿里、腾讯则推出了开源模型。不论开源、闭源,在透明性、合规性、安全性方面都有很多分歧与争议。DeepSeek作为一个开源模型,其爆火意味着开源模型领域的一次大的突破。从商业模型角度,也意味着模型门槛的大幅降低,有更多的企业、技术人员可以进入大模型领域,并开发针对自己特定领域的模型。这对AI领域的加速发展无疑是一种利好。预训练VS后训练前OpenAI联合创始人、SSI创始人Ilya Sutskever在NeurIPS 2024大会上发表演讲时表示,预训练时代即将结束,数据作为AI的化石燃料是有限的,目前用于AI预训练的数据已经达到了峰值。在此背景下,我们认为,AI领域正在进行一场范式的转变,重点将从预训练转向基于强化学习的后训练。DeepSeek R1已经展现出后训练可以涌现出强大的推理思考能力。算力VS应用DeepSeek的低成本模型让人担忧巨额的算力投资是否过度,但我们认为更低的成本会刺激更大的需求,DeepSeek对算力本身并不是一个利空。类似的情况我们在半导体、光伏都看到过,尽管成本大幅下降,但需求的提振还是让市场规模保持成长。从投资层面,除算力外,建议投资者2025年重点关注AI的应用,agent、智能硬件(AI眼镜等)、具身智能都将迎来发展机遇。1. 板块观点6珍惜有限 创造无限人形机器人产业链有望深度受益于AI行业快速发展。•随着AI性能的大幅提升及算力成本的下降,AI应用深度受益。而以人形机器人为代表的具身智能则是AI应用的重要方向。•特斯拉2024年四季度业绩说明再次对optimus释放乐观信息。特斯拉提出今年生产大约 10,000 台 Optimus 机器人,并且未来目标是每年增加一个数量级。当年产量100万台是,optimus成本有望控制在2万美元以内。•宇树科技的人形机器人登上春晚,对产业信心有提振作用,将进一步加快行业发展。自动化板块,中国地区订单出现回暖。尽管一季度中国PMI为49.1低于50,但我们认为更多是受到春节扰动。自动化行业下游覆盖中国各个制造业,能较好的反映出中国制造业的景气度。我们观察到中国工业机器人产量多个月持续回升。发那科、安川的中国地区订单也都实现正增长,其中2024财年三季度(2024.10~12月)发那科中国区订单增速更是达到了49.6%。工程机械板块表现稳健。12月挖机销量同比+16.0%,其中国内销量同比+22.1%。外销方面,工程机械12月出口金额50.47亿美元,同比+26.30%。国内方面,1月下旬国内大多数市场开始进入传统春节前的施工和需求淡季,呈现不同程度的转弱。预计2月下旬有望进入新一轮需求旺季。1. 板块观点7行情回顾珍惜有限 创造无限资料来源:wind, 五矿证券研究所2. 行情回顾9图表3:机械子版块涨跌幅截至2025/1/31涨跌幅相对沪深300指数涨跌幅估值指数代码指数简称1月2025年1月2025年PE(TTM)PB(LF)801072.SI通用设备3.33%3.33%6.33%6.33%40.732.48801074.SI专用设备1.63%1.63%4.62%4.62%30.122.35801076.SI轨交设备Ⅱ-7.83%-7.83%-4.84

立即下载
综合
2025-02-08
五矿证券
祁岩
32页
2.9M
收藏
分享

[五矿证券]:机械设备行业:高端制造产业跟踪(1月):DeepSeek爆火预示着投资方向的何种变化?,点击即可下载。报告格式为PDF,大小2.9M,页数32页,欢迎下载。

本报告共32页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共32页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
全球飞机交付量-分地区(架)
综合
2025-02-07
来源:交通运输行业事件点评:美国取消小额货物关税豁免政策,跨境空运兼具挑战和机遇
查看原文
全球航空可用货物吨公里 ACTK(单位:十亿吨公里)
综合
2025-02-07
来源:交通运输行业事件点评:美国取消小额货物关税豁免政策,跨境空运兼具挑战和机遇
查看原文
截至 2024H1 波音 777F 货机运力分布情况(架)
综合
2025-02-07
来源:交通运输行业事件点评:美国取消小额货物关税豁免政策,跨境空运兼具挑战和机遇
查看原文
2023 年中国跨境空运出口区域分布
综合
2025-02-07
来源:交通运输行业事件点评:美国取消小额货物关税豁免政策,跨境空运兼具挑战和机遇
查看原文
2023 年中国跨境空运出口货量 图4:2023 年中国跨境空运出口货量比重
综合
2025-02-07
来源:交通运输行业事件点评:美国取消小额货物关税豁免政策,跨境空运兼具挑战和机遇
查看原文
亚洲-北美航线全货机占比
综合
2025-02-07
来源:交通运输行业事件点评:美国取消小额货物关税豁免政策,跨境空运兼具挑战和机遇
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起