深入解析英伟达GB300液冷技术:价值链重塑与性能飞跃
随着人工智能技术的飞速发展,对高性能计算芯片的需求日益增长。英伟达最新推出的GB300系列服务器,在散热技术上迎来了重大革新,特别是其液冷系统的设计,成为了关注的焦点。本文将深入剖析GB300液冷系统的核心组件,对比GB200,揭示其在价值量和技术上的显著变化,帮助您更全面地理解新一代AI服务器的强大之处。
液冷服务器的构成解析
液冷服务器并非单一组件,而是由多个精密部件协同工作,以高效排出服务器运行时产生的巨量热量。其主要构成包括:
- 服务器: 这是IT机架的核心,内部承载着强大的计算单元。在高速运转时,服务器会产生大量热量,亟需高效的散热方案。
- Manifold(集流管/歧管): 在液冷系统中扮演着“交通枢纽”的角色。左侧的Left Manifold(冷侧集流管)负责将低温冷却液输送到各个服务器的冷板;右侧的Right Manifold(热侧集流管)则负责收集吸收了热量的冷却液,并将其送回CDU进行冷却。
- CDU(冷却分配单元): 它是液冷系统的“心脏”,负责冷却液体的分配和管理。CDU内部包含:
- Pump(泵): 为冷却液体的循环提供动力。
- Water Tank(水箱): 储存冷却液体。
- Plate Heat Exchanger(板式换热器): 将服务器吸收的热量与另一冷却介质(如来自冷却塔的水)进行交换,降低冷却液温度,实现循环利用。
- Cooling Tower(冷却塔): 通过与外界空气进行热交换,将CDU传递过来的热量散发出去,为冷却介质降温,以便再次投入使用。
GB300液冷系统的核心变化:冷板设计
GB300在液冷设计上的一个关键升级在于其冷板的配置。参考现有技术资料,我们可以看到以下重要变化:
在GB200 NVL72机架的结构中,通常采用18个compute tray和9个Switch tray的组合。每个compute tray中,一块大冷板覆盖着一个CPU和两个GPU(即一个Bianca板卡)。而GB300系列在设计上更加精细化:
- 冷板数量: GB200的总冷板需求约为45块大冷板(36块计算部分+9块Switch部分)。而GB300的设计则更进一步,每个芯片对应一块小冷板。因此,GB300的总需求量显著增加,达到108块小冷板(针对计算芯片)加上9块大冷板(针对Switch芯片)。
- 冷板价值: GB200的大冷板单块价值约为650美元。GB300的小冷板虽然单块价值有所下降(约240美元),但由于数量的急剧增加,整体冷板部分的价值贡献仍然非常可观。
软管与Manifold的价值量对比
在连接冷却液体流动的管路方面,GB300相比GB200也有所升级,体现在软管的价值量上:
- 软管: GB200的软管每柜(Rack)成本约为1200美元。而GB300的软管成本显著提升,达到1800-2000美元/柜。这可能与使用了更高性能、更耐用的材料或更复杂的连接设计有关。
- Manifold: 相比之下,GB200和GB300的Manifold价格差异不大,均维持在28000-30000美元/柜的水平,显示出其技术的成熟度和相对稳定的成本结构。
快接头的数量与价值量:精细化连接
快接头(Quick Disconnects, QDs)是确保液冷系统稳定运行的关键组件,它允许在不中断系统工作的情况下连接或断开冷却管路。GB300在这一环节上也进行了优化:
- 数量: GB200的计算部分包含126个快接头,Switch部分18个。而GB300的计算部分快接头数量翻倍至252个,Switch部分依然是18个。总计数量的大幅增加,反映了对更精细化、更多连接点的需求。
- 价值: GB200的快接头价格约为45美元/对。GB300的价格略有上涨至55美元/对,考虑到数量的翻倍,快接头在GB300的整体液冷价值构成中占据了更重要的位置。
供应商体系与技术演进
值得注意的是,GB300的液冷组件供应商体系发生了显著变化,反映了市场格局的动态调整和技术的进步。
- 冷板供应商: GB200的液冷板市场主要由AVC主导,双鸿和Cooler Master为辅。而GB300的供应商格局大变,Cooler Master成为主导者,AVC位居第二,双鸿份额大幅下降。
- 快插头供应商: GB200的快插头主要由欧美企业供应。GB300则升级为NVUQD方案,欧美企业份额减少,Cooler Master、AVC、富士达等成为主要供应商。
- CDU供应商: GB200的CDU供应商(如维谛)采用授权认证模式。GB300则取消了授权认证,改为以方案设计为核心的合作模式,供应商体系更加分散,台达、宝德、Cooler Master、维谛等均参与供应。
液冷产品的盈利能力
从商业角度来看,液冷产品的高性能伴随着可观的毛利率。CDU的毛利率通常在50%以上,而冷板、Manifold和快接头等组件的毛利率也普遍在30%以上。这表明,液冷技术不仅是性能的保证,也是高附加值业务的重要组成部分。
总而言之,英伟达GB300系列服务器通过在液冷技术上的精进,特别是冷板设计、快接头数量以及供应商体系的优化,显著提升了散热效率和整体性能。这些技术突破为 AI服务器 带来了更强大的算力支撑,也预示着数据中心散热技术向着更高效率、更低能耗的方向迈进,助力着 算力革命 的深入发展。
创建: 2025-09-09 复制本文链接
免责声明:本站所发布的所有文章、资讯、评论等内容,仅供网友学习交流和参考,不代表本站的立场和观点,不构成任何投资、交易、法律或其他建议。用户需自行承担因参考本站内容而产生的任何风险和责任。文章内容可能来源于网络、用户UGC或AI辅助生成,如有任何侵犯您权益的内容,请发送相关诉求到邮件到(bruce#fungather.com)或添加微信账号(full_star_service),我们将尽快核实并删除相关内容。
登录后才能发布评论哦
立即登录/注册