9月19日,在華為全連接大會2025主題演講環(huán)節(jié),華為常務(wù)董事、華為云計算CEO張平安圍繞“全面智能化,成就行業(yè)AI先鋒”,分享了華為云在AI云服務(wù)、大模型、具身智能、AI Agent等領(lǐng)域的技術(shù)創(chuàng)新與落地實踐。華為高級副總裁、華為云全球Marketing與銷售服務(wù)總裁楊友桂分享了數(shù)智化時代下,華為云幫助企業(yè)實現(xiàn)全球業(yè)務(wù)成功的創(chuàng)新技術(shù)和經(jīng)驗思考。
超節(jié)點可實現(xiàn)百萬卡超大集群
華為云CloudMatrix384昇騰AI云服務(wù)已全面上線。未來華為CloudMatrix超節(jié)點規(guī)格將從384卡升級到8192卡,可實現(xiàn)50-100萬卡的超大集群。華為云首創(chuàng)EMS彈性內(nèi)存存儲服務(wù),用內(nèi)存擴展顯存,顯著降低大模型多輪對話時延,大幅提升模型使用體驗。
隨著AI算力需求的暴增,傳統(tǒng)的數(shù)據(jù)中心已不適合構(gòu)建高效的AI基礎(chǔ)設(shè)施,單機柜功率要從10千瓦/每柜,升級到70千瓦/每柜,甚至是200千瓦/每柜,要從風(fēng)冷轉(zhuǎn)變到全液冷。華為云在貴州、內(nèi)蒙古、安徽部署了全液冷AI數(shù)據(jù)中心,實現(xiàn)單機柜80千瓦散熱,PUE低至1.1,并能夠?qū)崿F(xiàn)AI智能運維。企業(yè)無需改造或新建傳統(tǒng)數(shù)據(jù)中心,通過一對光纖,就能獲取華為云上高效的AI算力,也可以獲得全棧專屬AI云服務(wù)。
張平安指出,Token服務(wù)可以有效屏蔽復(fù)雜的底層技術(shù),直接為用戶提供最終的AI計算結(jié)果,是最高效的推理算力使用方式。CloudMatrix384超節(jié)點將算力、內(nèi)存、顯存等資源全面池化,把計算型任務(wù)、存儲型任務(wù)、AI專家系統(tǒng)解耦,將串行任務(wù)變成分布式并行任務(wù),極大地提升了系統(tǒng)的推理性能。在在線、近線和離線等不同時延推理場景中,CloudMatrix384平均單卡的推理性能達(dá)到H20的3到4倍。
會上,張平安宣布,CloudMatrix384 AI Token推理服務(wù)全面上線,以優(yōu)的性能、好的服務(wù)、高的質(zhì)量服務(wù)好客戶。
截止目前,使用華為云AI云服務(wù)的全球客戶數(shù)量從去年的321家增長到今年的1805家。如360納米AI依托CloudMatrix384的Token推理服務(wù),成功處理每天上千萬的內(nèi)容生成請求。Cloudmatrix384昇騰AI云服務(wù)支撐“磐石·科學(xué)基礎(chǔ)大模型”,將賦能中國科學(xué)院100多個院所的科研場景,不斷拓展人類認(rèn)知的前沿。
