机械设备行业AIDC智算中心-英伟达NV72与GB300高机柜密度、高功率带来的液冷投资机会梳理(三)
2025年3月31日AIDC智算中心-英伟达NV72与GB300高机柜密度、高功率带来的液冷投资机会梳理(三)行业评级:看好分析师刘巍邮箱liuwei03@stocke.com.cn证书编号S1230524040001分析师邱世梁邮箱qiushiliang@stocke.com.cn证书编号S1230520050001分析师白浪邮箱bailang@stocke.com.cn证书编号S1230525010003分析师尹仕昕邮箱yinshixin@stocke.com.cn证书编号S1230524040007添加标题95%21、英伟达新机组NV72的机柜密度相较于NV36大大提升,高功率需采用液冷技术以满足散热需求。NV72 每组机架的功率高达 120 千瓦,其功率远超风冷散热系统的承载上限,因此GB200或采用液冷技术,以满足散热需求。•液冷技术相对于风冷,具备低能耗、高散热、低噪音等技术优点,未来有望在AIDC广泛应用。冷板技术在行业内具有 10 年以上的研究积累,技术成熟度最高。2、GB200与GB300比较:GPU功耗提升,插槽设计支持定制,UQD需求有望倍增。进入GB300架构后,每TRAY需要6*2+2外接manifold 合计14对快接头,UQD需求有望倍增。新一代 GB300 AI 服务器性能显著提升,功耗也大幅增加,将取消风扇风冷版本因此将采用全水冷散热方案。3、投资建议•散热系统方面,建议关注研发和定制化能力强的液冷厂商:英维克;UQD和manifold方面,建议关注技术能力优秀的液冷组件供应商:川环科技、溯联股份。4、风险提示•海内外宏观和政策环境恶化;智算中心发展低于预期; AI应用发展不及预期。目录C O N T E N T S010203304NV72 采用液冷以满足散热需求,冷板式液冷成熟度最高GB300:GPU功耗提升,插拔设计支持定制,UQD需求有望倍增液冷方案L2A-L2L比较投资建议05风险提示NV72 采用液冷以满足散热需求,冷板式液冷成熟度最高01Partone4中之重5NVL36:该机组包含18个GB200 Computer Tray,每个GB200 Computer Tray中只有一个GB200组合,一共为18个Grace CPU和36个B200 GPU。每个计算托盘高度为2U,包含2个Bianca板,每个NV Switch托盘配备两个28.8Tb/s的NVSwitch5 ASIC芯片,每个芯片向后朝向背板与向前朝向前板都提供14.4Tb/s的带宽,每个NV Switch托盘有18个1.6T双端口OSFP插槽,水平连接到一对NVL36机架。NVL72:包含18个GB200 Compute Tray,每个compute tray 包含2个G200组合,因此包含36个Grace CPU和72个GPU。对应的显存为72 x 192GB = 13.8TB,对应的Fast Memory为18 x 1.7TB = 30.6TB。此外,还包含9个NV Switch Tray。每个计算托盘高度为1U,包含2个Bianca板,NV Switch托盘配备两个28.8Tb/s的NVSwitch5 ASIC。与 NVL36相比,我们认为NV72机柜密度大大提升,散热问题成为重中之重。资料来源:semi analysis,浙商证券研究所图2:GB200 NV72架构图1:GB200 NV36×2架构机柜密度大大提升智算中心概述NV7NV72 采用液冷以满足散热需求,冷板式液冷成熟度最高采用液冷以满足散热需求,冷板式液冷成熟度最高01016 NV72 每组机架的功率高达 120 千瓦,而普通用途的CPU 机架功率仅为 12 千瓦,高密度 H100 风冷机架的功率通常约为 40 千瓦。由于其功率远超风冷散热系统的承载上限,因此 GB200或采用液冷技术以满足散热需求。液冷技术分类液冷技术按冷却方式可分为喷淋式液冷、冷板式液冷、浸没式液冷等方式。 喷淋式液冷是将具有绝缘非腐蚀特性的冷却液直接喷淋到发热器件表面或与发热器件接触的扩展表面行热交换,实现冷却所属IT设备的目的。 冷板式液冷是指利用工作流体作为中间热量传输的媒介,将热量由热区传递到远端后再进行冷却。 浸没式液冷是指将发热的电子元器件(如CPU、GPU、内存和硬盘等)整体或部分地直接浸没在装有非导电惰性流体介质中,实现循环散热的液冷方式液冷技术分类直接式冷板式液冷单相冷板式液冷双相冷板式液冷间接式喷淋式液冷浸没式液冷单相浸没式液冷双相浸没式液冷图3:液冷技术分类资料来源:CDCC,绿色节能液冷白皮书、中兴通讯液冷白皮书、IDCE数据中心展公众号、浙商证券研究所冷板式液冷在行业内具有 10 年以上的研究积累,技术成熟度最高,且对设备防水无特殊要求,对现有设备改造难度低,成为主流的液冷应用技术。GB300:GPU功耗提升,插拔设计支持定制,UQD需求有望倍增02Partone702028 在GB200中, 2GPU+1CPU作为一个单元集成安装,每个computer Tray含2个GB200单元,每TRAY需要4对接头+2外接manifold 合计6对快接头。 进入GB300架构后,因各GPU及CPU形成单独的插拔设计和独立液冷路径,每个computer Tray 含4GPU+2CPU不变,所以每TRAY需要6*2+2外接manifold 合计14对快接头,UQD需求有望倍增。图4:GB200、GB300 Board 架构资料来源: Semi Analysis,零氪1+1 ,浙商证券研究所液冷系统组成及BOM拆解03Partone9030310不论是使用L2A(Liquid-to-air)或L2L(Liquid-to-liquid)的散热方案,都会使用到四大零件:•Cold plate(液冷板)•CDU(Coolant distribution unit,冷却液分配单元)•Manifold(冷却水歧管)•UQD(Universal Quick Disconnect,冷却液快接头)由这些零组件将废热从芯片表面带离后,L2A 会再透过风扇背门和热交换器、L2L 则透过室外冰水机使冷却液降温并重新再回到系统进行循环。资料来源:北京汉深流体技术有限公司官网,浙商证券研究所图7:液冷系统组成示意图030311GB200 NVL72 L2L Server RackServer-levelASP (US$)UnitContent ValueCold Plate Module300 6 1,800Cooling Fan25 8 200 Others100 Subtotal2,100Rack-levelASP(USS)UnitContent ValueCompute Tray2,10018 37,800NVLink Switch Tray700 9 6,300CDU30,0001 30,000Manifold12,0001 12,000UQD80 150 12,000Others800 Total98,900资料来源:零氪1+1,浙商证券研究所表2: GB200 NVL72 L2L BOM拆解38%31%12%12%7%co
[浙商证券]:机械设备行业AIDC智算中心-英伟达NV72与GB300高机柜密度、高功率带来的液冷投资机会梳理(三),点击即可下载。报告格式为PDF,大小1.66M,页数22页,欢迎下载。
