2025/1/17 11:40

中國(guó)信通院張海懿：智算中心高質(zhì)互聯(lián)成為智算應(yīng)用關(guān)注熱點(diǎn)

C114通信網(wǎng) 趙婷婷

C114訊 1月17日消息（趙婷婷）AI時(shí)代已經(jīng)來(lái)臨。大模型等新興AI應(yīng)用需求海量的算力支撐，一座座智算中心拔地而起，規(guī)模龐大的萬(wàn)卡集群逐漸投入商用。如何更好地實(shí)現(xiàn)智算中心互聯(lián)，服務(wù)AI應(yīng)用創(chuàng)新發(fā)展，業(yè)界做了大量研究工作。

1月16日，作為“2025中國(guó)光通信高質(zhì)量發(fā)展論壇”的開(kāi)篇之作，“智算中心互聯(lián)：算網(wǎng)協(xié)同，構(gòu)筑智算互聯(lián)新底座”線(xiàn)上研討會(huì)順利召開(kāi)。

會(huì)上，中國(guó)信息通信研究院技術(shù)與標(biāo)準(zhǔn)研究所（以下簡(jiǎn)稱(chēng)中國(guó)信通院標(biāo)準(zhǔn)所）所長(zhǎng)張海懿在演講時(shí)指出，當(dāng)前，我國(guó)主管部門(mén)持續(xù)發(fā)布算力基礎(chǔ)設(shè)施相關(guān)政策，引導(dǎo)算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展。AI大模型及相關(guān)應(yīng)用推動(dòng)智算中心向超萬(wàn)卡及以上集群發(fā)展，智算中心內(nèi)互聯(lián)、智算中心間互聯(lián)、智算應(yīng)用支撐等高質(zhì)互聯(lián)相關(guān)技術(shù)成為關(guān)注熱點(diǎn)。接下來(lái)，她介紹了相應(yīng)關(guān)鍵技術(shù)發(fā)展的具體情況。

智算中心內(nèi)互聯(lián)

張海懿指出，智算中心內(nèi)互聯(lián)一方面要支撐萬(wàn)億及以上量級(jí)參數(shù)量大模型訓(xùn)練，同時(shí)還要滿(mǎn)足超大規(guī)模組網(wǎng)、大帶寬、超低時(shí)延、高可用性等需求。

現(xiàn)階段，智算中心內(nèi)互聯(lián)相關(guān)協(xié)議和技術(shù)競(jìng)相發(fā)展，片間互聯(lián)開(kāi)放與專(zhuān)用模式持續(xù)競(jìng)爭(zhēng)。智算中心內(nèi)部組網(wǎng)以IB和基于以太網(wǎng)的多種方案并存方式發(fā)展，前者是以性能取勝，后者因其開(kāi)放性和性?xún)r(jià)比，在 AI大模型訓(xùn)練組網(wǎng)的占比也在進(jìn)一步提升。

大規(guī)模AI訓(xùn)練需要高效協(xié)同智算中心內(nèi)軟硬件資源，快速、高效、可移植的集合通信庫(kù)成為影響智能計(jì)算效率的重要因素。目前國(guó)內(nèi)外頭部廠商主要以各自研發(fā)獨(dú)有的高速集合通信庫(kù)為主，整體上捆綁特定芯片。為進(jìn)一步高效支撐智算部署與應(yīng)用，集合通信庫(kù)異構(gòu)兼容或成未來(lái)趨勢(shì)。

同時(shí)，大帶寬需求助推高速光模塊迭代加速。數(shù)據(jù)中心直調(diào)直檢光模塊速率約3~4年更新一代，AI智算引入后迭代周期呈現(xiàn)縮短趨勢(shì)，當(dāng)前處于800Gb/s速率為主階段，預(yù)計(jì)未來(lái)1~2年進(jìn)入1.6Tb/s速率，2030年3.2Tb/s速率將走向規(guī)模應(yīng)用。在AI應(yīng)用的驅(qū)動(dòng)下，高速光模塊應(yīng)用需求持續(xù)強(qiáng)勁，國(guó)內(nèi)外標(biāo)準(zhǔn)化布局加速向T+量級(jí)演進(jìn)延伸，同時(shí)為保障互聯(lián)質(zhì)量，智算中心對(duì)光模塊誤碼率等指標(biāo)可能會(huì)提出更高要求。

面對(duì)低能耗和低時(shí)延等應(yīng)用需求，線(xiàn)性驅(qū)動(dòng)可插拔模塊（LPO）及其應(yīng)用持續(xù)研究和探索。服務(wù)器機(jī)柜間互聯(lián)采用光學(xué)方式，單通道速率正在從112G向224G演進(jìn)，線(xiàn)性方案是降低能耗的有效途徑。當(dāng)前112G/lane LPO應(yīng)用處于探索階段，兼容性及標(biāo)準(zhǔn)化問(wèn)題有待持續(xù)研究評(píng)估，224G/lane LPO預(yù)計(jì)2025年進(jìn)行互通展示，考慮到性能和能耗的均衡等問(wèn)題，預(yù)計(jì)224G/lane可插拔方案傾向于線(xiàn)性接收可插拔光模塊（LRO）的可能性較大。

除此之外，芯片級(jí)光互聯(lián)提供高密度低能耗互聯(lián)新方案。芯片級(jí)光互連相較電互連或傳統(tǒng)可插拔模塊互連方式，具有大帶寬、低能耗、高集成等諸多優(yōu)勢(shì)。片間光互聯(lián)中，CPO主要用于交換網(wǎng)絡(luò)，OIO主要用于算存網(wǎng)絡(luò)，近期AI集群發(fā)展推動(dòng)OIO熱度迅速上升。目前，全球領(lǐng)先的硅光平臺(tái)依托其強(qiáng)大的芯片加工制造和先進(jìn)封裝能力，在芯片級(jí)光互聯(lián)方面不斷取得新突破。

另外，從目前發(fā)展情況來(lái)看，智算與光互聯(lián)雙向賦能，光互聯(lián)作用日益凸顯，光進(jìn)銅退趨勢(shì)進(jìn)一步持續(xù)，但短距的電互聯(lián)依靠其高可靠與低成本等特點(diǎn)，生命力依舊旺盛。另外，考慮能耗、靈活性和可靠性等大模型訓(xùn)練及推理需求，智算中心內(nèi)的全光交換組網(wǎng)和連接可靠性成為業(yè)界的持續(xù)關(guān)注點(diǎn)。

智算中心間互聯(lián)

智算中心間互聯(lián)的典型需求是長(zhǎng)距離、高吞吐量、算間高效協(xié)同等，需要通過(guò)長(zhǎng)距無(wú)損、極低故障率的互聯(lián)能力來(lái)支撐構(gòu)建分布式智算集群。目前發(fā)展情況如下：

一是大帶寬、低時(shí)延和高可靠需求凸顯。智算多集群分布式訓(xùn)練可期，算間互聯(lián)業(yè)務(wù)需求包括距離相近的多個(gè)智算中心間互聯(lián)、大規(guī)模樞紐算力節(jié)點(diǎn)間的互聯(lián)以及邊緣與核心云之間的互聯(lián)與協(xié)同，來(lái)實(shí)現(xiàn)分布式訓(xùn)練、訓(xùn)練推理協(xié)同、數(shù)據(jù)搬運(yùn)等場(chǎng)景。同時(shí)，多種應(yīng)用需要高質(zhì)量的互聯(lián)，包括大規(guī)模樞紐算力節(jié)點(diǎn)間的數(shù)據(jù)中心互聯(lián)、相近物理位置多數(shù)據(jù)中心間互聯(lián)、以及邊緣與核心數(shù)據(jù)中心間協(xié)同等。

二是智算分布式訓(xùn)練應(yīng)用試驗(yàn)加速探索�，F(xiàn)階段多家已經(jīng)開(kāi)展智算分布式訓(xùn)練實(shí)驗(yàn)/試驗(yàn)，但是分布式應(yīng)用仍面臨多重技術(shù)挑戰(zhàn)，例如廣域網(wǎng)絡(luò)性能需求、運(yùn)維管控復(fù)雜性、建網(wǎng)成本等都是制約因素，需要在多層多域單點(diǎn)技術(shù)突破、跨層跨域多技術(shù)協(xié)同融合等方面持續(xù)推進(jìn)技術(shù)創(chuàng)新。

三是干線(xiàn)啟動(dòng)400G規(guī)模部署，城域推動(dòng)800G+逐步試驗(yàn)。目前400G技術(shù)體系基本完善，我國(guó)運(yùn)營(yíng)商逐步啟動(dòng)干線(xiàn)場(chǎng)景規(guī)模部署，目前400G系統(tǒng)中的 WSS、OTU已實(shí)現(xiàn)C+L波段一體化設(shè)計(jì)，但一體化OA技術(shù)方案仍在探索驗(yàn)證之中。對(duì)于更高速率的傳輸技術(shù)，業(yè)界加快800G/1.6T技術(shù)標(biāo)準(zhǔn)研制，OIF和ITU等標(biāo)準(zhǔn)化組織正在開(kāi)展相關(guān)項(xiàng)目研究工作，產(chǎn)業(yè)界也已經(jīng)啟動(dòng)試點(diǎn)驗(yàn)證。

四是新型光纖加速助力構(gòu)建高質(zhì)量網(wǎng)絡(luò)。一方面，G.654.E等超低損光纖成為智算中心間互聯(lián)應(yīng)用優(yōu)配，適配400G及以上超高速長(zhǎng)距離、C+L多波段大容量等應(yīng)用，支撐優(yōu)質(zhì)互聯(lián)需求，是網(wǎng)絡(luò)傳輸性能提升的關(guān)鍵；另一方面，空芯光纖擁有諸多優(yōu)勢(shì)，發(fā)展?jié)撃芸善�，目前仍需突破制備工藝、工程部署等諸多難題，后續(xù)發(fā)展仍需業(yè)界持續(xù)加強(qiáng)協(xié)同，助力鍛造未來(lái)超低時(shí)延算力網(wǎng)。

智算應(yīng)用支撐

智算業(yè)務(wù)支撐方面，主要包括入算和端到端協(xié)同管控等功能。全光接入為用戶(hù)提供靈活品質(zhì)入算，主要包括家庭園區(qū)萬(wàn)兆全光入算、中小企業(yè)便捷一跳入算、大企業(yè)高品質(zhì)專(zhuān)線(xiàn)入算等。同時(shí)，通過(guò)端到端協(xié)同管控助力用戶(hù)快速入云入算。在接入側(cè)，進(jìn)一步增強(qiáng)用戶(hù)感知能力；

在數(shù)據(jù)中心互聯(lián)側(cè)，實(shí)現(xiàn)基于意圖的智能化管控；在數(shù)據(jù)中心網(wǎng)絡(luò)側(cè)，實(shí)現(xiàn)整個(gè)的數(shù)據(jù)中心網(wǎng)絡(luò)和數(shù)據(jù)中心互聯(lián)的協(xié)同。整體來(lái)看，用戶(hù)入算及智算訓(xùn)練等業(yè)務(wù)調(diào)度需要算網(wǎng)協(xié)同管控，綜合考慮用戶(hù)、組網(wǎng)以及算力提供者多方因素，在任務(wù)需求與算網(wǎng)資源綜合約束下，對(duì)多層級(jí)設(shè)備進(jìn)行彈性統(tǒng)一調(diào)度，在用戶(hù)和算力服務(wù)之間動(dòng)態(tài)按需建立連接。

另外，網(wǎng)絡(luò)大模型成為網(wǎng)絡(luò)自智邁向L4，甚至是更高階的關(guān)鍵技術(shù)。運(yùn)營(yíng)商、設(shè)備/軟件商紛紛布局網(wǎng)絡(luò)大模型，利用大模型高效的理解和生成能力增強(qiáng)網(wǎng)絡(luò)自智能力，加速智算網(wǎng)絡(luò)自智能力邁向高階自智L4。

張海懿最后表示，中國(guó)信通院標(biāo)準(zhǔn)所將持續(xù)開(kāi)展智算中心互聯(lián)相關(guān)技術(shù)產(chǎn)業(yè)發(fā)展、算力網(wǎng)絡(luò)性能監(jiān)測(cè)、算力接入1ms城市行動(dòng)計(jì)劃等工作，希望與業(yè)界一道協(xié)同構(gòu)建我國(guó)智算互聯(lián)網(wǎng)絡(luò)技術(shù)產(chǎn)業(yè)創(chuàng)新發(fā)展新生態(tài)，助力我國(guó)光通信行業(yè)高質(zhì)量發(fā)展。

給作者點(diǎn)贊

0 VS 0

寫(xiě)得不太好

版權(quán)說(shuō)明：凡注明來(lái)源為“C114通信網(wǎng)”的文章皆屬C114版權(quán)所有，除與C114簽署內(nèi)容授權(quán)協(xié)議的單位外，其他單位未經(jīng)允許禁止轉(zhuǎn)載、摘編，違者必究。如需使用，請(qǐng)聯(lián)系021-54451141。其中編譯類(lèi)僅出于傳遞更多信息之目的，系C114對(duì)海外相關(guān)站點(diǎn)最新信息的翻譯稿，僅供參考，不代表證實(shí)其描述或贊同其觀點(diǎn)，投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)；翻譯質(zhì)量問(wèn)題請(qǐng)指正。

相關(guān)鏈接

網(wǎng)絡(luò)信通院以太網(wǎng)服務(wù)器廣域網(wǎng)

中興通訊 UniEngine算網(wǎng)一體機(jī)首家獲得中國(guó)信通院工業(yè)5G專(zhuān)網(wǎng)一體化設(shè)備類(lèi)產(chǎn)品檢測(cè)認(rèn)證
C114通信網(wǎng) 15:44
中國(guó)信通院趙文玉：智算與光互聯(lián)雙向賦能 “四高”成為典型發(fā)展態(tài)勢(shì)
C114通信網(wǎng) 苡臻4-17
中國(guó)信通院盧丹：設(shè)備安全保障是6G網(wǎng)絡(luò)彈性的基礎(chǔ)性能力
C114通信網(wǎng) 水易4-11
行業(yè)首家！聯(lián)通云率先通過(guò)信通院“算力互聯(lián)互通能力要求-數(shù)據(jù)流動(dòng)”評(píng)估
廠商供稿 4-9