电子行业动态点评:英伟达Computex演讲启示,从低成本算力到高速互联的AI全面突围
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 电子 英伟达 Computex 演讲启示:从低成本算力到高速互联的 AI 全面突围 华泰研究–海外科技 电子 增持 (维持) 研究员 何翩翩 SAC No. S0570523020002 SFC No. ASI353 purdyho@htsc.com +(852) 3658 6000 联系人 程思远 SAC No. S0570123100077 chengsiyuan@htsc.com +(86) 21 2897 2228 2024 年 6 月 04 日│美国 动态点评 英伟达 Computex 直击:AI 计算与应用新纪元,由低成本算力开启 24 年 6 月 Computex 展会在中国台湾举行。英伟达 CEO 黄仁勋于 6 月 2日发表主题演讲,阐述英伟达与 AI 发展密不可分。自 12 年开始 AI 发展出现突破,CUDA 和 Alexnet 奠定了英伟达为 AI 提供大算力及软件生态的基础。而后 19 年收购 Mellanox 至今,发展 NVLink 和 InfiniBand 等传输互联技术,奠定了英伟达在解决 AI 算力和传输瓶颈一枝独秀的地位。而 17 年Transformers 出现后至 22 年 ChatGPT 诞生所掀起的 GenAI 浪潮,其发展跟英伟达的 GPU 也是密不可分。演讲有如下启示:算力成本的显著下降,使得处理海量数据成为可能,我们认为,从低成本算力到高速互联的 AI 革命已全面开启。 从 CUDA 生态拓展和 NIM 看 AI 商业应用探索 英伟达的 CUDA 生态圈为行业领先。至今,NVIDIA 已经拥有超过 350 个CUDA 应用库。从中我们可一窥面向企业的大模型应用。例如,台积电正在实施cuLITHO以加速芯片设计;还有基于 AI的最佳路径规划算法的 cuOPT、模拟量子计算机的 cuQUANTUM;数据处理加速器 cuDF 等。此外,英伟达还宣布推出一项 AI 模型推理服务——NVIDIA NIM。全球 2800 万开发者可以通过 NIM 将 AI 模型部署在云、数据中心或工作站上,可将构建 copilots、ChatGPT 聊天机器人等生成式 AI 应用的时间从数周缩短至几分钟。 NVLink 与 InfiniBand 互为臂助,共建英伟达超级 AI 工厂 当前 AI 巨头纷纷自研或升级互联技术以期突破算力飞涨带来的硬件限制。英伟达“快人一步”,其以自研 NVLink 为主、InfiniBand 为辅构建 AI 工厂互联版图,实现由 1 枚 GPU 到 32,000 枚 GPU 组成超算中心“AI 工厂”的完整互联。该 AI 工厂架构多由 InfiniBand 负责服务器间互联,芯片互联采用 NVLink 5.0,单枚英伟达 Blackwell GPU 支持 18 个 NVLink 5.0 100 GB/s 连接,总带宽可达 1.8TB/s,是 PCIe 5.0 带宽的 14 倍,超 AMD 自研 Infinity Fabric 4.0 总带宽约一倍。Blackwell 的下代 Rubin GPU 架构计划于 26 年推出,采用 NVLink 6.0,公司预计速率达 3600 GB/s,为 NVLink 5.0 两倍。 英伟达加入 Ethernet 战团,Ethernet、NVLink 及 InfiniBand 各司其长 黄仁勋在本次会上指出因 Ethernet 已在部分数据中心先入为主,InfiniBand难以全面铺开。Ethernet、NVLink 及 InfiniBand 在成本和性能上各有优劣,InfiniBand 及因完全私域化高速演进的 NVLink 在延迟和数据丢包方面表现突出,但开放的 Ethernet 性价比更优,未来互联三者将共存;类比铜光互联之争,铜缆因无需光电转换等成本相较低廉,但光缆在性能尤其远距离传输表现更为优异,因此未来二者将协同发展。Ethernet 方面,英伟达推出Spectrum Ethernet,相比传统 Ethernet 性能提高 1.6 倍;而谷歌、AMD 等巨头组成的 UEC 联盟发展 Ultra Ethernet,与英伟达分化为两大阵营竞争。 AI 机器人领域持续发力,英伟达引领物理智能浪潮 黄仁勋在会上强调了机器人技术和 AI 在未来发展的重要性,下一波 AI 是物理 AI,未来全球工业数字化转型市场规模有望达 50 万亿美元,包括自动化运营和数字孪生模型以降本增效。比亚迪电子、西门子、和谷歌旗下公司Intrinsic 等全球十多家机器人行业领导者正在将 NVIDIA Isaac 加速库、基于物理的仿真和人工智能模型集成到其软件框架和机器人模型中,提升工厂、仓库和配送中心的效率和安全,并充当重复或超精确任务的智能助手。 风险提示: AI 技术落地和推进不及预期,行业竞争激烈,中美贸易摩擦等;相关信息数据来自于公开客观信息,不代表对相关公司的研究覆盖和推荐。 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 电子 图表1: CPU+GPU 的运算时代 资料来源:英伟达 Computex Keynote、华泰研究 图表2: CPU 与 GPU 的拓展对比 资料来源:英伟达 Computex Keynote、华泰研究 图表3: 英伟达发布新款 RTX AI 电脑 资料来源:英伟达 Computex Keynote、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 3 电子 图表4: 英伟达 CUDA 拓展新市场 资料来源:英伟达 Computex Keynote、华泰研究 图表5: 英伟达 NIMS 推理微服务 资料来源:英伟达 Computex Keynote、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 4 电子 图表6: 英伟达 AI Factory 资料来源:英伟达 Computex Keynote、华泰研究 图表7: PCIe 迭代历程一览 版本 发布年份 编码技术 x16 吞吐能力(单向) 1.0 2003 NRZ 4.000 GB/s 2.0 2007 8.000 GB/s 3.0 2010 15.754 GB/s 4.0 2017 31.508 GB/s 5.0 2019 63.015 GB/s 6.0 2022 PAM-4 FEC 121.000 GB/s 7.0 计划 2025 242.000 GB/s 注: PCIe 技术允许数据全双工双向流动,因此 PCIe 5.0 两个方向的总吞吐量加起来达到 128 GB/s。 资料来源:PCI-SIC 官网,华泰研究 图表8: 英伟达采用 NVLink 实现芯片之间(chip-to-chip)互联 资料来源:英伟达 Computex Keynote、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 5 电
[华泰证券]:电子行业动态点评:英伟达Computex演讲启示,从低成本算力到高速互联的AI全面突围,点击即可下载。报告格式为PDF,大小1.36M,页数8页,欢迎下载。