作为丹佛斯中国数据中心签约代理商,北京汉深流体技术有限公司深耕液冷领域,为数据中心提供包括快换接头、液冷软管等在内的关键产品,助力高效散热解决方案落地。而在 AI 算力需求爆发的当下,液冷技术正成为支撑GPU 稳定运行的核心力量 ——2025 年 7 月 3 日,戴尔科技向 CoreWeave 交付了NVIDIA GB300 NVL72 机架规模解决方案,这一里程碑事件背后,液冷技术的应用正是保障其高性能运转的关键一环。
戴尔交付NVIDIA GB300 NVL72机架解决方案
2025年7月3日,戴尔科技(Dell Technologies)向CoreWeave交付了NVIDIA GB300 NVL72机架规模解决方案,这一事件标志着英伟达最新一代GPU正式进入商用阶段。在人工智能(AI)技术迅速发展的背景下,算力需求呈现爆发式增长,推动了全球半导体和AI基础设施市场的激烈竞争。
背景:NVIDIA GB300 NVL72的定位与技术特点
产品定位与市场背景
NVIDIA GB300 NVL72是英伟达Blackwell架构下的旗舰产品,定位于AI训练和高性能计算(HPC)市场。Blackwell架构是继Hopper之后的下一代GPU架构,旨在满足大规模AI模型训练和推理的需求。GB300 NVL72作为Blackwell架构的代表产品,代表了当前GPU计算技术的较高水平。
在全球AI竞争日益激烈的背景下,NVIDIA作为GPU计算领域的范例,不断推出性能更强、效率更高的产品,以巩固其市场地位。GB300 NVL72的推出,正是英伟达应对日益增长的AI算力需求的战略举措。
技术特点与性能优势
NVIDIA GB300 NVL72的核心技术特点包括:
多芯片模块(MCM)架构:GB300 NVL72由72个GB300 GPU芯片组成,采用先进的MCM封装技术,实现了更高的计算密度和更低的功耗。
Blackwell架构:Blackwell架构是英伟达专为AI和HPC设计的新一代GPU架构,相比Hopper架构,性能提升了约40%,能效比提升了约30%。
高带宽内存(HBM):GB300 NVL72配备了HBM3e高带宽内存,内存带宽达到345.6TB/s,为大规模AI模型的训练提供了充足的内存支持。
多精度计算支持:支持FP64、FP32、FP16、INT8等多种数据精度,能够满足不同应用场景的需求。
能效优化:GB300 NVL72在性能提升的同时,功耗控制更加出色,能效比达到105 TFLOPS/W,较前代产品有显著提升。
这些技术特点使GB300 NVL72成为当前市场上性能佳、效率高的GPU产品之一,能够满足最复杂的大规模AI模型训练需求。
产品交付亮点
此次戴尔向CoreWeave交付的NVIDIA GB300 NVL72机架规模解决方案,代表了戴尔在AI基础设施领域的行业优质技术。这些技术不仅展现了戴尔在AI计算领域的深度布局,也反映了其在硬件、软件和生态系统的整合能力。以下是戴尔此次解决方案中采用的关键行业前沿技术的深度分析:
1. 基于NVIDIA Blackwell架构的GPU技术
NVIDIA GB300 NVL72是英伟达最新一代Blackwell架构的代表产品,专为AI训练和推理设计。Blackwell架构在性能、能效和可扩展性方面进行了全面升级,其性能相比前代产品提升了50%以上。GB300 NVL72结合了72个Blackwell GPU和36个基于Arm架构的Grace CPU,提供了更为优质的计算能力,能够处理大规模AI模型的训练和推理任务。
技术亮点:
高性能计算能力:GB300 NVL72提供了每秒数十万亿次的浮点运算能力(TFLOPS),支持大规模的AI模型训练和推理。
高能效比:Blackwell架构通过优化计算单元和内存带宽,提升了每瓦特的计算性能,降低了数据中心的能耗。
支持大规模并行计算:NVL72的多GPU架构允许用户构建高密度的计算集群,提升AI训练的效率。
2. 液冷服务器技术
戴尔此次交付的解决方案采用了液冷服务器技术,以应对AI计算对散热和能效的高要求。液冷技术通过将冷却液直接接触服务器的发热部件(如GPU和CPU),可以显著降低服务器的运行温度,从而提升稳定性和能效。
技术亮点:
高效散热:液冷技术相比传统风冷技术,能够更有效地将热量从服务器内部排出,减少风扇和散热器的能耗。
降低噪音:由于不需要高转速风扇,液冷服务器运行时的噪音更低,提升了数据中心的环境舒适度。
提升服务器寿命:稳定的温度环境有助于延长服务器的使用寿命,降低维护成本。
3. AI虚拟化与资源管理
戴尔的解决方案结合了VMware的GPU虚拟化技术,通过vSphere Bitfusion技术实现GPU资源的动态分配和共享。这一技术允许用户在多个虚拟机之间灵活分配GPU资源,增加GPU的利用率。
技术亮点:
GPU资源动态分配:vSphere Bitfusion技术可以根据工作负载的需求,动态调整GPU资源的分配,避免GPU资源的闲置。
跨网络共享GPU:该技术允许用户通过网络共享GPU资源,使得多个用户或应用可以同时使用同一块GPU,提高资源利用率。
简化管理:通过虚拟化技术,用户可以像管理CPU一样管理GPU资源,简化了AI基础设施的管理复杂性。
4. AI优化的硬件平台
戴尔此次解决方案中采用了PowerEdge服务器,这是戴尔最新的服务器产品线,专为AI和高性能计算(HPC)设计。PowerEdge服务器在硬件设计上进行了多项优化,以满足AI计算的需求。
技术亮点:
高内存容量:PowerEdge服务器配备了大容量内存,支持大规模AI模型的训练和推理。
高速I/O:服务器提供了高速的输入/输出接口,确保数据在服务器和存储设备之间的快速传输。
生命周期管理:PowerEdge服务器内置了生命周期管理控制器,简化了服务器的部署和管理流程,减少了安装和配置的时间。
5. AI软件生态整合
戴尔的解决方案不仅包括硬件,还整合了NVIDIA的AI软件套件,如NVIDIA AI Enterprise和NeMo框架。这些软件提供了从模型训练到推理的完整工具链,帮助用户快速构建和部署AI应用。
技术亮点:
AI模型训练与推理工具:NVIDIA AI Enterprise套件提供了丰富的AI模型训练和推理工具,支持多种深度学习框架(如TensorFlow、PyTorch等)。
NeMo框架:NeMo框架允许用户在本地环境中进行大语言模型(LLM)的训练和微调,降低了对云端计算资源的依赖。
预验证模型库:戴尔的解决方案集成了多个预验证的AI模型,用户可以直接使用这些模型进行推理,降低了开发门槛。
6. 开放生态系统与合作伙伴关系
戴尔在AI基础设施领域构建了一个开放的生态系统,与NVIDIA、VMware、AMD等合作伙伴紧密合作,提供兼容性强、扩展性高的解决方案。这种开放性使得用户可以根据自己的需求选择不同的硬件和软件组合,避免了技术锁定的风险。
技术亮点:
多硬件兼容:戴尔的解决方案支持多种GPU和CPU的组合,用户可以根据具体需求选择不同的硬件平台。
多云支持:戴尔的解决方案支持多云部署,用户可以在公有云、私有云和混合云之间灵活切换。
开源框架集成:戴尔的解决方案与主流开源AI框架(如PyTorch、TensorFlow)深度集成,支持用户在本地和云端进行AI开发。
7. 端到端AI解决方案
戴尔的解决方案覆盖了从设备到数据中心的全栈AI基础设施,提供了一个端到端的AI解决方案。这种解决方案不仅包括硬件和软件,还包括AI咨询服务和部署支持,帮助用户从零开始构建AI应用。
技术亮点:
一站式服务:戴尔提供从硬件采购、软件部署到AI模型训练和推理的全流程服务,简化了用户的AI开发流程。
AI咨询服务:戴尔的AI专家团队可以为用户提供AI战略咨询和最佳实践建议,帮助用户增加AI投资的回报。
快速部署:戴尔的解决方案支持快速部署,用户可以在短时间内完成AI基础设施的搭建和配置。
戴尔此次向CoreWeave交付的NVIDIA GB300 NVL72机架规模解决方案,展示了其在AI基础设施领域的行业前沿技术,通过结合NVIDIA Blackwell架构的GPU、液冷服务器、AI虚拟化技术、AI优化的硬件平台、AI软件生态整合、开放生态系统和端到端AI解决方案,戴尔为用户提供了高性能、高能效、易管理的AI计算平台。这些技术不仅提升了AI计算的效率和灵活性,也为用户在AI创新和应用开发方面提供了强有力的支持。
NVIDIA GB300 NVL72技术参数
NVIDIA GB300 NVL72 是一个机架级解决方案,专为数据中心和高性能计算应用设计。它结合了先进的计算能力和优化的电源管理,为大规模AI和HPC应用提供支持。
技术参数
GPU:
数量:144个 Blackwell Ultra GPU (B300)
每个 GPU 显存:288GB HBM3E
每个 GPU 功耗(TDP):1400W
每个 GPU FP4 性能:208.333 TFLOPS
CPU:
数量:72个 Grace CPU
每个 CPU 核心数:72个 Arm Neoverse V2 核心
内存:
GPU显存(HBM3E):20TB
系统内存(DDR5):40TB
互连带宽:
CX8 互连带宽:14.4TB/s
特点
高性能计算:专为数据中心和高性能计算应用设计,支持复杂的多步骤请求处理。
集成设计:集成了 Blackwell Ultra GPU 和 Grace CPU,形成一个统一的计算平台。
高带宽内存和互连:提供快速的数据访问和处理能力,支持大规模数据操作。
优化的电源管理:采用动态电源管理系统(DrMOS),机柜总成本降低约35-40%。
推理能力:整体 FP4 性能达到15PFLOPS,显著提升了AI推理和模型处理效率。
戴尔与CoreWeave的合作:战略意义与市场影响
戴尔的战略布局
戴尔作为优质的IT基础设施和解决方案提供商,近年来积极布局AI市场,与NVIDIA保持了紧密的合作关系。此次向CoreWeave交付GB300 NVL72机架规模解决方案,标志着戴尔在AI基础设施领域的进一步深耕。
戴尔的战略布局主要体现在以下几个方面:
完善产品线:通过引入GB300 NVL72,戴尔完善了其AI服务器产品线,能够为客户提供从边缘到核心的数据中心级AI解决方案。
强化生态系统:戴尔通过与NVIDIA的深度合作,强化了其在AI生态系统的地位,为客户提供端到端的AI解决方案。
抢占市场先机:作为最早交付GB300 NVL72解决方案的厂商之一,戴尔抢占了市场先机,有望在AI基础设施市场获得更大的发展。
CoreWeave的市场定位
CoreWeave是一家专注于AI基础设施的初创公司,致力于为AI研究和应用提供高性能、高效率的计算平台。CoreWeave选择与戴尔合作,采购GB300 NVL72机架规模解决方案,反映了其对戴尔技术实力和市场地位的认可。
CoreWeave的市场定位主要体现在以下几个方面:
专注于AI基础设施:CoreWeave专注于AI基础设施的建设和运营,为AI研究和应用提供支持。
与大型云服务提供商差异化竞争:相比AWS、Azure等大型云服务提供商,CoreWeave更加灵活,能够为客户提供定制化的AI基础设施解决方案。
技术创新:CoreWeave注重技术创新,通过采用最新的AI硬件和软件技术,为客户提供更高效的AI计算服务。
双方合作的市场影响
戴尔与CoreWeave的合作,对AI基础设施市场产生了深远的影响:
加速GB300 NVL72的商业化应用:通过戴尔的渠道和CoreWeave的市场需求,GB300 NVL72将更快地进入商业化应用阶段,推动AI技术的发展。
促进AI基础设施的普及:双方的合作,降低了AI基础设施的使用门槛,促进了AI技术的普及和应用。
推动行业标准的形成:通过合作,双方推动了AI基础设施行业标准的形成,为行业的健康发展奠定了基础。
各厂商的最新动态分析
NVIDIA:持续创新,巩固市场地位
NVIDIA作为GPU计算领域的头部品牌,持续推出性能更强、效率更高的产品,以巩固其市场地位。GB300 NVL72的推出,是NVIDIA在AI计算领域的又一重要里程碑。
NVIDIA的最新动态主要体现在以下几个方面:
产品创新:NVIDIA不断推出新产品,如GB300 NVL72,以满足市场对高性能AI计算的需求。
生态系统建设:NVIDIA通过与戴尔、CoreWeave等合作伙伴的合作,构建了完善的AI生态系统,为客户提供端到端的解决方案。
市场拓展:NVIDIA积极拓展全球市场,特别是在中国、日本等亚洲市场,获取更多发展机会。
戴尔:完善产品线,强化生态系统
戴尔作为高质量的IT基础设施和解决方案提供商,近年来积极布局AI市场,与NVIDIA保持了紧密的合作关系。此次向CoreWeave交付GB300 NVL72机架规模解决方案,标志着戴尔在AI基础设施领域的进一步深耕。
戴尔的最新动态主要体现在以下几个方面:
产品线完善:通过引入GB300 NVL72,戴尔完善了其AI服务器产品线,能够为客户提供从边缘到核心的数据中心级AI解决方案。
生态系统强化:戴尔通过与NVIDIA的深度合作,强化了其在AI生态系统的地位,为客户提供端到端的AI解决方案。
市场先机抢占:作为最早交付GB300 NVL72解决方案的厂商之一,戴尔抢占了市场先机,有望在AI基础设施市场获得更大的发展前景。
CoreWeave:技术创新,差异化竞争
CoreWeave是一家专注于AI基础设施的初创公司,致力于为AI研究和应用提供高性能、高效率的计算平台。CoreWeave选择与戴尔合作,采购GB300 NVL72机架规模解决方案,反映了其对戴尔技术实力和市场地位的认可。
CoreWeave的最新动态主要体现在以下几个方面:
技术创新:CoreWeave注重技术创新,通过采用最新的AI硬件和软件技术,为客户提供更高效的AI计算服务。
差异化竞争:相比AWS、Azure等大型云服务提供商,CoreWeave更加灵活,能够为客户提供定制化的AI基础设施解决方案。
市场拓展:CoreWeave积极拓展市场,特别是在AI研究和应用领域。
未来展望:AI基础设施市场的趋势与挑战
市场趋势
高性能计算需求持续增长:随着AI技术的不断发展,高性能计算需求将持续增长,推动AI基础设施市场的扩张。能效比成为关键竞争因素:在能源成本不断上升的背景下,能效比将成为AI基础设施市场的重要竞争因素。多云战略成为主流:企业将采用多云战略,以降低对单一云服务提供商的依赖,提高数据安全性和灵活性。
挑战与机遇
技术挑战:AI技术的快速发展,对AI基础设施提出了更高的要求,如更高的计算性能、更低的功耗等。
市场挑战:市场竞争日益激烈,企业需要不断创新,以保持竞争优势。
机遇:随着AI技术的普及,AI基础设施市场将迎来更大的发展机遇,企业可以通过技术创新和市场拓展增加机遇。
戴尔向CoreWeave交付NVIDIA GB300 NVL72机架规模解决方案,标志着英伟达最新GPU开始正式商用落地。这一事件不仅反映了NVIDIA在AI计算领域的行业地位,也展示了戴尔和CoreWeave在AI基础设施市场的战略布局。未来,随着AI技术的不断发展和市场需求的持续增长,AI基础设施市场将迎来更大的发展机遇,企业需要不断创新,以保持竞争优势。
相关产品
免责声明
- 凡本网注明“来源:Ky开元集团”的所有作品,均为浙江兴旺宝明通网络有限公司-Ky开元集团合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:Ky开元集团”。违反上述声明者,本网将追究其相关法律责任。
- 本网转载并注明自其他来源(非Ky开元集团)的作品,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。
- 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。