資訊
`
2025/5/20 14:09
華為王慶文:打造堅實算力底座,加速AI賦能千行萬業(yè)
0
0

C114訊 5月20日消息(九九)5月17日,2025世界電信和信息社會日“智算產(chǎn)業(yè)創(chuàng)新發(fā)展論壇”在南昌舉辦,華為昇騰計算業(yè)務(wù)副總裁王慶文在演講中指出,大模型的性能在很多方面已經(jīng)可以與人類媲美,并且在快速收斂,從原來的千模百態(tài)收斂到十來家,隨著推理成本的大幅下降開始在很多行業(yè)獲得應(yīng)用,為醫(yī)療診斷、工業(yè)質(zhì)檢、AI教學(xué)等方面帶來卓有成效的提升。

Gartner預(yù)測,未來兩年80%中國企業(yè)將部署生成式AI,60%會將AI融入產(chǎn)品服務(wù),標(biāo)志著企業(yè)AI應(yīng)用從通用場景向核心生產(chǎn)場景滲透的“奇點時刻”到來,企業(yè)AI部署已進(jìn)入全面深化階段。

王慶文進(jìn)一步指出,運營商憑借領(lǐng)先的泛在多級訓(xùn)推資源,既能滿足中小企業(yè)的靈活需求,也能支撐大型企業(yè)核心業(yè)務(wù)及海量用戶場景,并通過多租戶部署技術(shù),保障大租戶資源獨立、中小租戶性能提升的同時全方位確保數(shù)據(jù)安全。

王慶文介紹,昇騰從基礎(chǔ)硬件、算子到推理系統(tǒng)全面創(chuàng)新,面向不同的推理場景需求,為包含運營商在內(nèi)的客戶及伙伴提供集高性能、高可靠、易部署、開源開放于一體的推理解決方案。

面向大型企業(yè)、C端超級應(yīng)用等需要大規(guī)模推理算力資源的場景,高并發(fā)、低時延下的吞吐性能是關(guān)鍵。昇騰國內(nèi)首創(chuàng)大規(guī)模專家并行集群推理方案:通過將MoE模型的多專家權(quán)重數(shù)據(jù) 分散部署到更多的卡上,降低單卡權(quán)重加載時延,讓模型解碼輸出更快;單卡內(nèi)存容量占用的降低,也能夠支持更大用戶并發(fā)所需的KV緩存,實現(xiàn)系統(tǒng)的更大吞吐性能,平均單卡吞吐性能提升3倍以上,大幅降低每Token推理成本,幫助運營商構(gòu)筑高性能的AI算力基礎(chǔ)設(shè)施,為行業(yè)客戶帶來更優(yōu)的業(yè)務(wù)體驗。

面向中小企業(yè)、學(xué)校和醫(yī)院等機構(gòu)需要快速部署、快速落地AI應(yīng)用的需求,昇騰使能運營商打造大模型應(yīng)用一體機。打包量化、調(diào)優(yōu)等工具鏈顯著提升50%部署效率,通過MLA(Multi-Head Latent Attention)親和等特性,提升吞吐性能90%,從模型部署到應(yīng)用上線實現(xiàn)“即開即用”,降低AI部署門檻,幫助運營商賦能千行萬業(yè)智能化轉(zhuǎn)型。目前已有超140家合作伙伴基于昇騰發(fā)布大模型應(yīng)用一體機產(chǎn)品,為各行業(yè)場景提供廣泛的智能應(yīng)用。

演講的最后,王慶文表示,昇騰將致力于打造堅實的算力底座,攜手運營商及ISV等產(chǎn)業(yè)伙伴破解算力供給與場景落地的關(guān)鍵挑戰(zhàn),加速AI在千行萬業(yè)的落地應(yīng)用,為產(chǎn)業(yè)融合升級注入強勁動能。

版權(quán)說明:C114刊載的內(nèi)容,凡注明來源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來源。編譯類文章僅出于傳遞更多信息之目的,不代表證實其描述或贊同其觀點;翻譯質(zhì)量問題請指正。

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網(wǎng)版權(quán)所有 舉報電話:021-54451141 用戶注銷