计算机行业:DeepSeek将如何改变AI应用?
中 泰 证 券 研 究 所专 业 | 领 先 | 深 度 | 诚 信|证券研究报告|2 0 2 5 . 0 2 . 1 3DeepSeek将如何改变AI应用?分析师:闻学臣执业证书编号:S0740519090007分析师:苏仪执业证书编号:S0740520060001分析师:王雪晴执业证书编号:S0740524120003联系人:刘一哲Email:liuyz03@zts.com.cn2核心观点◼ 从kimi(月之暗面)到智谱,从豆包(字节)到DeepSeek,中国基础大模型一直处于快速演进之中,演进的主旋律则体现为性能提升和成本降低,与计算机历史上PC、互联网的发展逻辑类似。我们总结了以下三个关键词:◼ 关键词1:低成本。与暴力美学的大模型相对应的就是高成本,动则数百上千万元的成本投入在很大程度上制约了下游需求的释放,在中国当前的宏观环境下这种挑战更为明显。DeepSeek带来的成本指数级下降,将会大大加速AI应用的落地进程。◼ 关键词2:开源。伴随闭源基础大模型能力不断提升之后,是否会向上侵蚀应用市场成为了市场的一种担忧。而开源体系大大降低这种可能:1)开源体系需要生态繁荣,基模厂商与应用厂商是合作关系;2)对于应用厂商而言,开源大模型的可获得性、可把握性更强,更容易基于此构建自己的垂直模型和能力。◼ 关键词3:中国。中国具有广阔的应用场景,但一方面接入海外OpenAI模型存在一定的障碍,另一方面中国的基础大模型能力存在差距。DeepSeek缩小了这种能力差距,一定程度上补齐了中国AI应用的底座短板。3CONTENTS目录CCONTENTS专 业 | 领 先 | 深 度 | 诚 信中 泰 证 券 研 究 所1Big Picture:从基础模型的能力上限和应用成本谈起4图表:AI应用分析框架资料来源:中泰证券研究所应用的分析框架:能力上限与应用成本共同决定应用场景◼ AI随模型能力的提升和应用成本的降低,共同解锁更多应用场景。技术-能力上限曲线价格-应用成本曲线模型能力上限模型定价应用场景随模型能力提升和成本降低而不断解锁;DeepSeek的低成本+强能力将解锁更多应用场景;对话场景;智能客服;……营销医疗法律……AI搜索;AI代码;……5图表:R1在各项任务中的表现资 料 来 源 : DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcement Learning,中泰证券研究所图表:DeepSeek V3和其他模型的表现对比资料来源:DeepSeek-V3 Technical Report,中泰证券研究所能力上限之一:DeepSeek系列模型拥有比肩GPT-4o、Claude3.5和o1的能力◼ DeepSeek V3再次展现出能力上限突破,在MMLU、MATH 500等任务中均表现除了优于GPT-4o和Claude-3.5-Sonnet的SOTA能力。其发布的推理模型DeepSeek-R1在数学、编程等推理任务中接近或达到了o1的水平。6图表:随步数提升R1-Zero的AIME任务准确度资料来源:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所能力上限之二:后训练阶段大规模应用强化学习,表现推理能力扩展◼ DeepSeek模型在Post-Train阶段大规模应用了强化学习方法。R1使用了冷启动微调+强化学习方法,R1-Zero版本模型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和long-CoT能力涌现等)。图表:深度思考能力提升资料来源:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所DeepSeek-R1-Zero的能力随步数提升DeepSeek-R1-Zero自然涌现long-CoT能力7图表:训练过程中R1-Zero表现出的Aha Moment资料来源:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所能力上限之二:纯强化学习的R1-Zero展现出“Aha Moment”能力涌现◼ RL下模型展现出了自主开发先进问题解决策略的行为:1)模型表现出了“Aha moment”,突然学会更有效的推理方式,也增加了推理复杂度;2)模型在训练过程中出现了Reflection能力,能够重新评估初始方法来学习为问题分配更多的思考时间。虽然应用纯强化学习方法的R1-Zero在稳定性、可读性上仍有差距(存在多语言混杂生成现象),但Aha Moment、Reflection等能力的出现展现出了纯强化学习方法的巨大潜力。8图表:Janus-Pro多模态理解和视觉生成表现资料来源:Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling,中泰证券研究所能力上限之三:开源Janus-Pro模型,图像生成和多模态理解能力大幅提升◼ Janus-Pro 结合了优化的训练策略,扩展了训练数据集和模型规模。通过这些改进,Janus-Pro 在多模态理解和文本到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。◼ 作为在GenEval等评测中超越DALL-E 3和Stable Diffusion 3-Medium的开源模型,Janus-Pro也展现出了更多应用潜力。9图表:DeepSeek-R1训练过程资料来源:木尧,中泰证券研究所应用成本之一:极致优化的工程化方法,大幅降低训推成本◼ DeepSeek在训练阶段采用了多种方法降低训练成本,并保证模型的良好表现。1)冷启动:构建并收集少量 Long-CoT 数据来微调模型,而非单纯运用大规模RLHF或RL,很好地平衡了性能和成本;2)MLA(多头潜在注意力机制)的优化:降低了键值量缓存需求,减少算力压力;后续的ALFS(无辅助损失负载均衡策略)方法:能让MoE的专家在偏好值和工作量上达成平衡状态,当负载比较大的时候能够转移到其他专家上,加强了模型整体性能的负载均衡与稳定性。10图表:闭源模型与开源模型的差距正在缩小资料来源:Epoch AI,中泰证券研究所图表:DeepSeek-R1 api价格与o1对比资料来源:DeepSeek,中泰证券研究所应用成本之二:低推理成本+开源,api成本仅为o1几十分之一◼ 对V3进行蒸馏的R1在数学、代码能力上再次显著提升。MoE架构的R1模型共有671B规模,激活后的参数量为37B,部署时能够大大节省推理成本。◼ DeepSeek开源了模型,API的调用价格也大幅低于OpenAI。以Output API价格为例,DeepSeek-R1大约是OpenAI的3.7%。以R1为代表的优秀开源模型的能力也离闭
[中泰证券]:计算机行业:DeepSeek将如何改变AI应用?,点击即可下载。报告格式为PDF,大小1.37M,页数26页,欢迎下载。
