COMPUTEX-NVIDIA公司今天宣布推出一款新型大內(nèi)存AI超級計算機--NVIDIA DGX™超級計算機,該計算機由NVIDIA® GH200 Grace Hopper超級芯片和NVIDIA NVLink®交換機系統(tǒng)提供動力,旨在為生成型AI語言應(yīng)用、推薦系統(tǒng)和數(shù)據(jù)分析工作負載開發(fā)巨型的下一代模型。
DGX GH200是第一臺將Grace Hopper超級芯片與NVIDIA NVLink交換系統(tǒng)配對使用的超級計算機,NVLink交換系統(tǒng)是一種新的互連方式,能夠使DGX GH200系統(tǒng)中的所有GPU作為一個整體協(xié)同工作。上一代系統(tǒng)只提供八個GPU與NVLink結(jié)合為一個GPU,而不影響性能。
(資料圖片僅供參考)
DGX GH200架構(gòu)提供的NVLink帶寬是上一代的48倍,以單顆GPU的簡單編程提供了大規(guī)模AI超級計算機的能力。
為人工智能先驅(qū)者提供的新研究工具谷歌云、Meta和微軟是首批有望獲得DGX GH200的用戶,以探索其在生成型AI工作負載方面的能力。英偉達還打算將DGX GH200的設(shè)計作為藍本提供給云服務(wù)提供商和其他超大規(guī)模企業(yè),以便他們能夠為自己的基礎(chǔ)設(shè)施進一步定制。
"谷歌云計算副總裁Mark Lohmeyer表示:"構(gòu)建先進的生成模型需要創(chuàng)新的AI基礎(chǔ)設(shè)施方法。"新的NVLink規(guī)模和Grace Hopper超級芯片的共享內(nèi)存解決了大規(guī)模人工智能的關(guān)鍵瓶頸問題,我們期待著為谷歌云和我們的生成性人工智能計劃探索其能力。"
"隨著人工智能模型越來越大,它們需要強大的基礎(chǔ)設(shè)施,可以擴展以滿足日益增長的需求,"Meta公司基礎(chǔ)設(shè)施、人工智能系統(tǒng)和加速平臺副總裁Alexis Bj?rlin說。"NVIDIA的Grace Hopper設(shè)計看起來為研究人員提供了探索新方法的能力,以解決他們最大的挑戰(zhàn)。"
"訓(xùn)練大型人工智能模型在傳統(tǒng)上是一項資源和時間密集型任務(wù),"微軟Azure基礎(chǔ)設(shè)施公司副總裁Girish Bablani說。"DGX GH200處理TB級數(shù)據(jù)集的潛力將使開發(fā)人員能夠以更大的規(guī)模和加速的速度進行先進的研究。"
新的NVIDIA Helios超級計算機將推動研究和開發(fā)英偉達正在建造自己的基于DGX GH200的人工智能超級計算機,為其研究人員和開發(fā)團隊的工作提供動力。
這臺超級計算機被命名為NVIDIA Helios,它將擁有四個DGX GH200系統(tǒng)。每個系統(tǒng)都將與英偉達Quantum-2 InfiniBand網(wǎng)絡(luò)互連,為訓(xùn)練大型人工智能模型提高數(shù)據(jù)吞吐量。Helios將包括1,024個Grace Hopper超級芯片,預(yù)計將于今年年底上線。
完全集成,專為巨型模型而生DGX GH200超級計算機包括英偉達軟件,為最大的人工智能和數(shù)據(jù)分析工作負載提供了一個交鑰匙的全棧解決方案。NVIDIA Base Command™軟件提供了AI工作流程管理、企業(yè)級集群管理、加速計算、存儲和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的庫,以及為運行AI工作負載而優(yōu)化的系統(tǒng)軟件。
此外,還包括NVIDIA AI Enterprise,這是NVIDIA AI平臺的軟件層。它提供了100多個框架、預(yù)訓(xùn)練模型和開發(fā)工具,以簡化生產(chǎn)型AI的開發(fā)和部署,包括生成型AI、計算機視覺、語音AI等。
供應(yīng)情況NVIDIA DGX GH200超級計算機預(yù)計將于今年年底上市。