deepseek大模型生态报告
I deepseek 大模型生态报告 赛迪研究院电子信息研究所 2025 年 2 月 I 目 录 一、DeepSeek 大模型背景 ....................... 1 (一)深度求索公司情况 ................... 1 (二)模型迭代历程 ....................... 2 (三)研发团队情况 ....................... 3 1. 北京大学罗福莉 ............................................ 4 2. 北京大学高华佐 ............................................ 4 3. 北京邮电大学曾旺丁 .................................... 5 4. 北京大学朱琪豪 ............................................ 5 5. 北京大学代达劢 ............................................ 6 6. 北京大学王炳宣 ............................................ 6 7. 浙江大学梁文锋 ............................................ 7 二、DeepSeek 大模型应用现状 ................... 8 (一)国内情况 ........................... 8 (二)全球情况 .......................... 10 三、DeepSeek 大模型技术特点 .................. 11 (一)技术创新 .......................... 11 1. 压缩:从结构到量化 .................................. 11 (1)多层注意力 MLA ........................... 12 (2)FP8 混合精度训练框架 ................ 13 2. 并行:对硬件的极限使用 .......................... 16 (1)DualPipe 跨节点通信 ..................... 16 (2)无辅助损失的负载均衡策略 ......... 18 (3)底层通信优化 ................................. 20 3. 总结 .............................................................. 20 (二)训练成本 .......................... 21 四、DeepSeek 大模型产业生态 .................. 22 (一)企业 .............................. 22 II 1. DeepSeek 系列新模型正式上线昇腾社区,华为小艺已接入 DeepSeek .......................................... 22 2. 三大运营商全面接入 DeepSeek ................. 23 3. 多家公司宣布接入 DeepSeek ..................... 23 4. 微软、英伟达、亚马逊全部接入 DeepSeek! .................................................................................... 25 5. 燧原科技实现全国各地智算中心 DeepSeek的全量推理服务部署 ............................................... 26 6. 多家券商也积极“拥抱”DeepSeek .......... 26 (二)生态 .............................. 27 1. Deepseek 应用 27 日登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜 .................. 27 2. DeepSeek 在开源社区 GitHub 上的 Star 数首次超越 OpenAI ......................................................... 28 3. 国家超算互联网正式上线 DeepSeek ......... 29 4. 传 DeepSeek 正准备适配中国国产 GPU ... 29 5. DeepSeek 的风,火速吹遍了终端企业 ...... 30 (三)应用 .............................. 32 1. 文学 .............................................................. 32 2. 编程 .............................................................. 32 (四)基础设施 .......................... 35 五、DeepSeek 大模型产业影响 .................. 35 (一)对人工智能技术的影响 .............. 35 1. 吴恩达谈 DeepSeek:中国 AI 迎头赶上,扩大算力并不是 AI 进步的唯一途径 ......................... 35 2. 蒸馏技术将成为行业突破口 ...................... 36 (二)对产业生态的影响 .................. 37 1. DeepSeek 开源对于企业战略价值 .............. 37 2. DeepSeek 是否真的绕开了 CUDA? ......... 39 3. DeepSeek 会导致对智算中心的需求大幅减少吗?........................................................................ 39 III (三)对国际竞争的影响 .................. 46 1. DeepSeek 的崛起,冲击了全球科技供应链的核心玩家 ................................................................... 46 2. AI 低成本化,最大输家可能不是 Nvidia,而是依赖大模型收费的 AI 公司 ................................. 46 3. AI 进入创业黄金时代 .................................. 47 4. DeepSeek 的崛起引发了全球资本市场的剧烈震荡..............
[赛迪研究院]:deepseek大模型生态报告,点击即可下载。报告格式为PDF,大小2.36M,页数150页,欢迎下载。