作為丹佛斯中國數據中心簽約代理商,北京漢深流體技術有限公司深耕液冷領域,為數據中心提供包括快換接頭、液冷軟管等在內的關鍵產品,助力高效散熱解決方案落地。而在 AI 算力需求爆發的當下,液冷技術正成為支撐GPU 穩定運行的核心力量 ——2025 年 7 月 3 日,戴爾科技向 CoreWeave 交付了NVIDIA GB300 NVL72 機架規模解決方案,這一里程碑事件背后,液冷技術的應用正是保障其高性能運轉的關鍵一環。
戴爾交付NVIDIA GB300 NVL72機架解決方案
2025年7月3日,戴爾科技(Dell Technologies)向CoreWeave交付了NVIDIA GB300 NVL72機架規模解決方案,這一事件標志著英偉達最新一代GPU正式進入商用階段。在人工智能(AI)技術迅速發展的背景下,算力需求呈現爆發式增長,推動了全球半導體和AI基礎設施市場的激烈競爭。
背景:NVIDIA GB300 NVL72的定位與技術特點
產品定位與市場背景
NVIDIA GB300 NVL72是英偉達Blackwell架構下的旗艦產品,定位于AI訓練和高性能計算(HPC)市場。Blackwell架構是繼Hopper之后的下一代GPU架構,旨在滿足大規模AI模型訓練和推理的需求。GB300 NVL72作為Blackwell架構的代表產品,代表了當前GPU計算技術的較高水平。
在全球AI競爭日益激烈的背景下,NVIDIA作為GPU計算領域的范例,不斷推出性能更強、效率更高的產品,以鞏固其市場地位。GB300 NVL72的推出,正是英偉達應對日益增長的AI算力需求的戰略舉措。
技術特點與性能優勢
NVIDIA GB300 NVL72的核心技術特點包括:
多芯片模塊(MCM)架構:GB300 NVL72由72個GB300 GPU芯片組成,采用先進的MCM封裝技術,實現了更高的計算密度和更低的功耗。
Blackwell架構:Blackwell架構是英偉達專為AI和HPC設計的新一代GPU架構,相比Hopper架構,性能提升了約40%,能效比提升了約30%。
高帶寬內存(HBM):GB300 NVL72配備了HBM3e高帶寬內存,內存帶寬達到345.6TB/s,為大規模AI模型的訓練提供了充足的內存支持。
多精度計算支持:支持FP64、FP32、FP16、INT8等多種數據精度,能夠滿足不同應用場景的需求。
能效優化:GB300 NVL72在性能提升的同時,功耗控制更加出色,能效比達到105 TFLOPS/W,較前代產品有顯著提升。
這些技術特點使GB300 NVL72成為當前市場上性能佳、效率高的GPU產品之一,能夠滿足最復雜的大規模AI模型訓練需求。
產品交付亮點
此次戴爾向CoreWeave交付的NVIDIA GB300 NVL72機架規模解決方案,代表了戴爾在AI基礎設施領域的行業優質技術。這些技術不僅展現了戴爾在AI計算領域的深度布局,也反映了其在硬件、軟件和生態系統的整合能力。以下是戴爾此次解決方案中采用的關鍵行業前沿技術的深度分析:
1. 基于NVIDIA Blackwell架構的GPU技術
NVIDIA GB300 NVL72是英偉達最新一代Blackwell架構的代表產品,專為AI訓練和推理設計。Blackwell架構在性能、能效和可擴展性方面進行了全面升級,其性能相比前代產品提升了50%以上。GB300 NVL72結合了72個Blackwell GPU和36個基于Arm架構的Grace CPU,提供了更為優質的計算能力,能夠處理大規模AI模型的訓練和推理任務。
技術亮點:
高性能計算能力:GB300 NVL72提供了每秒數十萬億次的浮點運算能力(TFLOPS),支持大規模的AI模型訓練和推理。
高能效比:Blackwell架構通過優化計算單元和內存帶寬,提升了每瓦特的計算性能,降低了數據中心的能耗。
支持大規模并行計算:NVL72的多GPU架構允許用戶構建高密度的計算集群,提升AI訓練的效率。
2. 液冷服務器技術
戴爾此次交付的解決方案采用了液冷服務器技術,以應對AI計算對散熱和能效的高要求。液冷技術通過將冷卻液直接接觸服務器的發熱部件(如GPU和CPU),可以顯著降低服務器的運行溫度,從而提升穩定性和能效。
技術亮點:
高效散熱:液冷技術相比傳統風冷技術,能夠更有效地將熱量從服務器內部排出,減少風扇和散熱器的能耗。
降低噪音:由于不需要高轉速風扇,液冷服務器運行時的噪音更低,提升了數據中心的環境舒適度。
提升服務器壽命:穩定的溫度環境有助于延長服務器的使用壽命,降低維護成本。
3. AI虛擬化與資源管理
戴爾的解決方案結合了VMware的GPU虛擬化技術,通過vSphere Bitfusion技術實現GPU資源的動態分配和共享。這一技術允許用戶在多個虛擬機之間靈活分配GPU資源,增加GPU的利用率。
技術亮點:
GPU資源動態分配:vSphere Bitfusion技術可以根據工作負載的需求,動態調整GPU資源的分配,避免GPU資源的閑置。
跨網絡共享GPU:該技術允許用戶通過網絡共享GPU資源,使得多個用戶或應用可以同時使用同一塊GPU,提高資源利用率。
簡化管理:通過虛擬化技術,用戶可以像管理CPU一樣管理GPU資源,簡化了AI基礎設施的管理復雜性。
4. AI優化的硬件平臺
戴爾此次解決方案中采用了PowerEdge服務器,這是戴爾最新的服務器產品線,專為AI和高性能計算(HPC)設計。PowerEdge服務器在硬件設計上進行了多項優化,以滿足AI計算的需求。
技術亮點:
高內存容量:PowerEdge服務器配備了大容量內存,支持大規模AI模型的訓練和推理。
高速I/O:服務器提供了高速的輸入/輸出接口,確保數據在服務器和存儲設備之間的快速傳輸。
生命周期管理:PowerEdge服務器內置了生命周期管理控制器,簡化了服務器的部署和管理流程,減少了安裝和配置的時間。
5. AI軟件生態整合
戴爾的解決方案不僅包括硬件,還整合了NVIDIA的AI軟件套件,如NVIDIA AI Enterprise和NeMo框架。這些軟件提供了從模型訓練到推理的完整工具鏈,幫助用戶快速構建和部署AI應用。
技術亮點:
AI模型訓練與推理工具:NVIDIA AI Enterprise套件提供了豐富的AI模型訓練和推理工具,支持多種深度學習框架(如TensorFlow、PyTorch等)。
NeMo框架:NeMo框架允許用戶在本地環境中進行大語言模型(LLM)的訓練和微調,降低了對云端計算資源的依賴。
預驗證模型庫:戴爾的解決方案集成了多個預驗證的AI模型,用戶可以直接使用這些模型進行推理,降低了開發門檻。
6. 開放生態系統與合作伙伴關系
戴爾在AI基礎設施領域構建了一個開放的生態系統,與NVIDIA、VMware、AMD等合作伙伴緊密合作,提供兼容性強、擴展性高的解決方案。這種開放性使得用戶可以根據自己的需求選擇不同的硬件和軟件組合,避免了技術鎖定的風險。
技術亮點:
多硬件兼容:戴爾的解決方案支持多種GPU和CPU的組合,用戶可以根據具體需求選擇不同的硬件平臺。
多云支持:戴爾的解決方案支持多云部署,用戶可以在公有云、私有云和混合云之間靈活切換。
開源框架集成:戴爾的解決方案與主流開源AI框架(如PyTorch、TensorFlow)深度集成,支持用戶在本地和云端進行AI開發。
7. 端到端AI解決方案
戴爾的解決方案覆蓋了從設備到數據中心的全棧AI基礎設施,提供了一個端到端的AI解決方案。這種解決方案不僅包括硬件和軟件,還包括AI咨詢服務和部署支持,幫助用戶從零開始構建AI應用。
技術亮點:
一站式服務:戴爾提供從硬件采購、軟件部署到AI模型訓練和推理的全流程服務,簡化了用戶的AI開發流程。
AI咨詢服務:戴爾的AI專家團隊可以為用戶提供AI戰略咨詢和最佳實踐建議,幫助用戶增加AI投資的回報。
快速部署:戴爾的解決方案支持快速部署,用戶可以在短時間內完成AI基礎設施的搭建和配置。
戴爾此次向CoreWeave交付的NVIDIA GB300 NVL72機架規模解決方案,展示了其在AI基礎設施領域的行業前沿技術,通過結合NVIDIA Blackwell架構的GPU、液冷服務器、AI虛擬化技術、AI優化的硬件平臺、AI軟件生態整合、開放生態系統和端到端AI解決方案,戴爾為用戶提供了高性能、高能效、易管理的AI計算平臺。這些技術不僅提升了AI計算的效率和靈活性,也為用戶在AI創新和應用開發方面提供了強有力的支持。
NVIDIA GB300 NVL72技術參數
NVIDIA GB300 NVL72 是一個機架級解決方案,專為數據中心和高性能計算應用設計。它結合了先進的計算能力和優化的電源管理,為大規模AI和HPC應用提供支持。
技術參數
GPU:
數量:144個 Blackwell Ultra GPU (B300)
每個 GPU 顯存:288GB HBM3E
每個 GPU 功耗(TDP):1400W
每個 GPU FP4 性能:208.333 TFLOPS
CPU:
數量:72個 Grace CPU
每個 CPU 核心數:72個 Arm Neoverse V2 核心
內存:
GPU顯存(HBM3E):20TB
系統內存(DDR5):40TB
互連帶寬:
CX8 互連帶寬:14.4TB/s
特點
高性能計算:專為數據中心和高性能計算應用設計,支持復雜的多步驟請求處理。
集成設計:集成了 Blackwell Ultra GPU 和 Grace CPU,形成一個統一的計算平臺。
高帶寬內存和互連:提供快速的數據訪問和處理能力,支持大規模數據操作。
優化的電源管理:采用動態電源管理系統(DrMOS),機柜總成本降低約35-40%。
推理能力:整體 FP4 性能達到15PFLOPS,顯著提升了AI推理和模型處理效率。
戴爾與CoreWeave的合作:戰略意義與市場影響
戴爾的戰略布局
戴爾作為優質的IT基礎設施和解決方案提供商,近年來積極布局AI市場,與NVIDIA保持了緊密的合作關系。此次向CoreWeave交付GB300 NVL72機架規模解決方案,標志著戴爾在AI基礎設施領域的進一步深耕。
戴爾的戰略布局主要體現在以下幾個方面:
完善產品線:通過引入GB300 NVL72,戴爾完善了其AI服務器產品線,能夠為客戶提供從邊緣到核心的數據中心級AI解決方案。
強化生態系統:戴爾通過與NVIDIA的深度合作,強化了其在AI生態系統的地位,為客戶提供端到端的AI解決方案。
搶占市場先機:作為最早交付GB300 NVL72解決方案的廠商之一,戴爾搶占了市場先機,有望在AI基礎設施市場獲得更大的發展。
CoreWeave的市場定位
CoreWeave是一家專注于AI基礎設施的初創公司,致力于為AI研究和應用提供高性能、高效率的計算平臺。CoreWeave選擇與戴爾合作,采購GB300 NVL72機架規模解決方案,反映了其對戴爾技術實力和市場地位的認可。
CoreWeave的市場定位主要體現在以下幾個方面:
專注于AI基礎設施:CoreWeave專注于AI基礎設施的建設和運營,為AI研究和應用提供支持。
與大型云服務提供商差異化競爭:相比AWS、Azure等大型云服務提供商,CoreWeave更加靈活,能夠為客戶提供定制化的AI基礎設施解決方案。
技術創新:CoreWeave注重技術創新,通過采用最新的AI硬件和軟件技術,為客戶提供更高效的AI計算服務。
雙方合作的市場影響
戴爾與CoreWeave的合作,對AI基礎設施市場產生了深遠的影響:
加速GB300 NVL72的商業化應用:通過戴爾的渠道和CoreWeave的市場需求,GB300 NVL72將更快地進入商業化應用階段,推動AI技術的發展。
促進AI基礎設施的普及:雙方的合作,降低了AI基礎設施的使用門檻,促進了AI技術的普及和應用。
推動行業標準的形成:通過合作,雙方推動了AI基礎設施行業標準的形成,為行業的健康發展奠定了基礎。
各廠商的最新動態分析
NVIDIA:持續創新,鞏固市場地位
NVIDIA作為GPU計算領域的頭部品牌,持續推出性能更強、效率更高的產品,以鞏固其市場地位。GB300 NVL72的推出,是NVIDIA在AI計算領域的又一重要里程碑。
NVIDIA的最新動態主要體現在以下幾個方面:
產品創新:NVIDIA不斷推出新產品,如GB300 NVL72,以滿足市場對高性能AI計算的需求。
生態系統建設:NVIDIA通過與戴爾、CoreWeave等合作伙伴的合作,構建了完善的AI生態系統,為客戶提供端到端的解決方案。
市場拓展:NVIDIA積極拓展全球市場,特別是在中國、日本等亞洲市場,獲取更多發展機會。
戴爾:完善產品線,強化生態系統
戴爾作為高質量的IT基礎設施和解決方案提供商,近年來積極布局AI市場,與NVIDIA保持了緊密的合作關系。此次向CoreWeave交付GB300 NVL72機架規模解決方案,標志著戴爾在AI基礎設施領域的進一步深耕。
戴爾的最新動態主要體現在以下幾個方面:
產品線完善:通過引入GB300 NVL72,戴爾完善了其AI服務器產品線,能夠為客戶提供從邊緣到核心的數據中心級AI解決方案。
生態系統強化:戴爾通過與NVIDIA的深度合作,強化了其在AI生態系統的地位,為客戶提供端到端的AI解決方案。
市場先機搶占:作為最早交付GB300 NVL72解決方案的廠商之一,戴爾搶占了市場先機,有望在AI基礎設施市場獲得更大的發展前景。
CoreWeave:技術創新,差異化競爭
CoreWeave是一家專注于AI基礎設施的初創公司,致力于為AI研究和應用提供高性能、高效率的計算平臺。CoreWeave選擇與戴爾合作,采購GB300 NVL72機架規模解決方案,反映了其對戴爾技術實力和市場地位的認可。
CoreWeave的最新動態主要體現在以下幾個方面:
技術創新:CoreWeave注重技術創新,通過采用最新的AI硬件和軟件技術,為客戶提供更高效的AI計算服務。
差異化競爭:相比AWS、Azure等大型云服務提供商,CoreWeave更加靈活,能夠為客戶提供定制化的AI基礎設施解決方案。
市場拓展:CoreWeave積極拓展市場,特別是在AI研究和應用領域。
未來展望:AI基礎設施市場的趨勢與挑戰
市場趨勢
高性能計算需求持續增長:隨著AI技術的不斷發展,高性能計算需求將持續增長,推動AI基礎設施市場的擴張。能效比成為關鍵競爭因素:在能源成本不斷上升的背景下,能效比將成為AI基礎設施市場的重要競爭因素。多云戰略成為主流:企業將采用多云戰略,以降低對單一云服務提供商的依賴,提高數據安全性和靈活性。
挑戰與機遇
技術挑戰:AI技術的快速發展,對AI基礎設施提出了更高的要求,如更高的計算性能、更低的功耗等。
市場挑戰:市場競爭日益激烈,企業需要不斷創新,以保持競爭優勢。
機遇:隨著AI技術的普及,AI基礎設施市場將迎來更大的發展機遇,企業可以通過技術創新和市場拓展增加機遇。
戴爾向CoreWeave交付NVIDIA GB300 NVL72機架規模解決方案,標志著英偉達最新GPU開始正式商用落地。這一事件不僅反映了NVIDIA在AI計算領域的行業地位,也展示了戴爾和CoreWeave在AI基礎設施市場的戰略布局。未來,隨著AI技術的不斷發展和市場需求的持續增長,AI基礎設施市場將迎來更大的發展機遇,企業需要不斷創新,以保持競爭優勢。
相關產品
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。