金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁

中 泰 证 券 研 究 所专 业 | 领 先 | 深 度 | 诚 信|证券研究报告|2 0 2 5 . 0 3 . 1 3DeepSeek银行部署加速,AI金融应用迎来跃迁分析师:闻学臣执业证书编号:S0740519090007分析师:苏仪执业证书编号:S0740520060001分析师:王雪晴执业证书编号:S0740524120003联系人:蒋丹Email:jiangdan@zts.com.cn2核心观点◼ DeepSeek开源使金融机构能够轻松获得前沿模型能力,且大幅降低部署成本。其通过对训练方式、算法架构和推理方法的工程化优化大幅降低了部署成本。近期采用大规模RL训练方法的阿里QwQ-32B等模型也在缩小规模的同时达到了DeepSeek R1 671B的应用效果,有望进一步催生银行落地应用。◼ 我们认为金融行业人工智能的应用价值大体可以分为三个层次:降本增效,价值创造与决策赋能。在实际银行落地应用中,可能包括:1)降本增效:智能客服、信贷审批、合同质检;2)价值创造:AI编程、智能风控、智能营销等;3)决策赋能:深度分析和决策辅助。◼ 从实际落地应用情况看,大行发力更早,中小银行正在快速追赶。如工商银行、建设银行、招商银行等大行布局更早,邮储银行、浦发银行、江苏银行等也有较为领先布局应用。 AI一体机的出现为机构提供了全新的解决方案,凭借其开箱即用、软硬件一体化设计等优势,正在成为很多中小银行智能化转型的重要选择。◼ 建议关注:宇信科技、京北方、天阳科技、长亮科技、百融云等。◼ 风险提示:AI技术落地不及预期、竞争加剧、信息更新不及时等。3CONTENTS目录CCONTENTS专 业 | 领 先 | 深 度 | 诚 信中 泰 证 券 研 究 所1DeepSeek开源、低成本、强推理助推银行业应用4图表:随步数提升R1-Zero的AIME任务准确度资料来源:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所性能:后训练阶段大规模应用强化学习,表现推理能力扩展◼ DeepSeek模型在Post-Train阶段大规模应用了强化学习方法。R1使用了冷启动+大规模强化学习方法,R1-Zero版本模型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和long-CoT能力涌现等)。图表:深度思考能力提升资料来源:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,中泰证券研究所DeepSeek-R1-Zero的能力随步数提升DeepSeek-R1-Zero自然涌现long-CoT能力5图表:DeepSeek R1架构图资料来源:DeepSeek,中泰证券研究所性能:DeepSeek推理架构优化,可适配银行高并行、高响应的业务场景◼ DeepSeek通过优化训练方法显著降低了算力消耗,使其在大规模数据处理中的成本更具优势。 它在MoE架构的基础上,通过多头潜注意力机制(Multi-Head Latent Attention,MLA)进行优化;在后训练阶段采用冷启动+大规模强化学习方式,不再使用传统SFT做大规模监督微调,甚至绕过了一些CUDA,采用PTX汇编来提升能力;在推理场景下通过大规模跨节点专家并行(Expert Parallelism,EP)来优化通信开销,尽可能实现负载均衡。图表:DeepSeek R1训练方法资料来源:木尧,中泰证券研究所6图表:DeepSeek DAU快速增长资料来源:AI产品榜,中泰证券研究所图表:闭源模型与开源模型的差距正在缩小资料来源:Epoch AI,中泰证券研究所开源易获得:DeepSeek使私有化部署模型也能够追平前沿闭源模型水平◼ 以DeepSeek R1为代表的优秀开源模型的能力离闭源模型越来越近。行业普遍认为如果开源软件达到闭源80%以上能力,就足以压缩闭源的生存空间。DeepSeek能力能够比肩OpenAI o1,开源使各行业机构能够轻松获取前沿模型能力,且可直接进行私有化部署或商业化开发。7图表:DeepSeek R1成本与理论收入资料来源:DeepSeek,中泰证券研究所成本:DeepSeek低价策略下理论成本利润率依旧可达545%,部署成本极低◼ DeepSeek理论成本利润率极高,成本还有优化空间。通过优化,能够在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。以2025年2月27-28日数据为例,DeepSeek V3 和 R1 推理服务占用节点总和,峰值占用为 278 个节点,平均占用 226.75 个节点(每个节点为 8 个 H800 GPU)。假定 GPU 租赁成本为 2 美金/小时,总成本为 $87,072/天。如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为 $562,027,成本利润率 545%。图表:DeepSeek服务负荷统计资料来源:DeepSeek,中泰证券研究所8图表:QwQ-32B模型表现资料来源:阿里,中泰证券研究所性能:开源QwQ-32B性能比肩满血R1,再次降低部署成本◼ 阿里近期开源的QwQ-32B模型基于320亿参数规模,在数学推理、代码生成及通用任务中表现亮眼,综合性能对标DeepSeek-R1(6710亿参数,激活量370亿)。该模型大幅降低部署成本,支持在消费级显卡(如英伟达RTX 4090)上本地运行,满足快速响应及数据安全需求。同时,QwQ-32B集成智能体(Agent)能力,可调用工具并基于环境反馈调整推理逻辑,为定制化AI方案提供基础。9图表:各模型微调示例数与准确度对比资料来源:s1: Simple test-time scaling,中泰证券研究所图表:s1表现出的Test time Scaling资料来源:s1: Simple test-time scaling,中泰证券研究所性能:蒸馏小型模型展现Test-time Scaling,可支持多项基础业务场景◼ 通过将DeepSeek-R1的推理能力蒸馏到更小的模型中,较小的模型也能具备强大的推理能力。DeepSeek开源了从15 亿到700亿参数的R1蒸馏版本。这些模型基于Qwen和Llama等架构蒸馏,表明复杂的推理能力可以被封装在更小、更高效的模型中。从论文结论看,蒸馏比单独依赖强化学习训练更为高效,且蒸馏与强化学习的结合可以进一步提升模型性能。◼ 2025年2月,科学家李飞飞团队带领以不到50美元的费用训练了一个能力比肩DeepSeek-R1的s1模型,也展现了蒸馏模型的更多应用潜力。S1仅使用1000个微调示例就达到了类似r1的准确度模型展现出随推理时间增加准确度增加的Test time Scaling10图表:大模型数据类型资料来源:中泰证券研究所数据:大规模RL提升非结构化数据分析能力,释放私域数据价值◼ DeepSeek可以通过API接口或者数据中台架构,实现与传统银行技术

立即下载
金融
2025-03-17
中泰证券
25页
1.43M
收藏
分享

[中泰证券]:金融行业:DeepSeek银行部署加速,AI金融应用迎来跃迁,点击即可下载。报告格式为PDF,大小1.43M,页数25页,欢迎下载。

本报告共25页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共25页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
地方债和信用债融资 图表51:6M 国股银票转贴现利率与存单利差
金融
2025-03-17
来源:固定收益定期:农产品价格继续回落
查看原文
融资周频预测 图表49:6M 国股银票转贴现利率
金融
2025-03-17
来源:固定收益定期:农产品价格继续回落
查看原文
阴极铜库存 图表47:PTA 库存天数
金融
2025-03-17
来源:固定收益定期:农产品价格继续回落
查看原文
电解铝库存 图表45:纯碱库存
金融
2025-03-17
来源:固定收益定期:农产品价格继续回落
查看原文
库存周频预测 图表43:主要钢材品种库存
金融
2025-03-17
来源:固定收益定期:农产品价格继续回落
查看原文
公路物流运价指数 图表41:执飞航班架次
金融
2025-03-17
来源:固定收益定期:农产品价格继续回落
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起