C114訊 1月21日消息(邵鵬慧)近年來,AI技術(shù)發(fā)展呈爆發(fā)式增長趨勢,特別是AI 大模型的亮相,引發(fā)了全球范圍的應(yīng)用熱潮,不少業(yè)內(nèi)專家將2024年視為“AI應(yīng)用落地元年”。以AIGC為代表的新應(yīng)用、新需求崛起,推動智能算力規(guī)模快速增長,與此同時,算力緊缺、功耗飛漲等問題逐漸顯現(xiàn)。在這樣的背景下,建設(shè)高效、靈活、綠色智算中心成為滿足 AI 算力需求的必然選擇。
數(shù)據(jù)中心歷經(jīng)計算中心、信息中心、云數(shù)據(jù)中心,現(xiàn)已邁入算力中心時代。早在十幾年前,浪潮信息便開始預(yù)制化集裝箱數(shù)據(jù)中心領(lǐng)域建設(shè)布局,經(jīng)過多年技術(shù)積累,浪潮信息采用預(yù)制化AIDC解決方案的元腦“算力工廠”正式投運,僅用120天時間由119個集裝箱拼接搭建而成。
近日,C114走進浪潮信息元腦算力工廠,切身體會預(yù)制化AIDC解決方案的落地實踐,極其承載的大模型開發(fā)應(yīng)用等多業(yè)務(wù)場景。
預(yù)制化AIDC展現(xiàn)顯著優(yōu)勢
據(jù)了解,傳統(tǒng)數(shù)據(jù)中心建設(shè)周期長,需經(jīng)過設(shè)計、土建、機電安裝、調(diào)試等多個階段,規(guī)劃及建設(shè)周期通常在3年以上,跟不上高速增長的AI算力節(jié)奏,難以滿足各行業(yè)對算力快速迭代和高速增長的迫切需求。
同時,面對國家 “3060” 政策下的能耗挑戰(zhàn)、東數(shù)西算的布局考量以及散熱技術(shù)的革新需求,數(shù)據(jù)中心節(jié)能降耗勢在必行。此外,傳統(tǒng)數(shù)據(jù)中心還面臨擴容難的挑戰(zhàn),無法第一時間跟隨技術(shù)迭代和業(yè)務(wù)發(fā)展需求完成升級調(diào)整,可能面臨建成即落后、供不應(yīng)求的窘境,投資回報率難以保障。在此背景下,預(yù)制化AIDC解決方案應(yīng)運而生。
在接受C114采訪時,浪潮信息服務(wù)器產(chǎn)品部產(chǎn)品行銷處經(jīng)理周相峰表示,預(yù)制化AIDC具備快速交付、高效節(jié)能、靈活擴展等核心優(yōu)勢,可滿足新型數(shù)據(jù)中心快速上線、綠色低碳、靈活部署的剛性需求。
周相峰介紹,與傳統(tǒng)數(shù)據(jù)中心相比,預(yù)制化AIDC采用預(yù)制集裝箱模塊化設(shè)計,以“搭積木”的方式進行搭建,與土建解耦,不受現(xiàn)場條件限制,工期可縮短80%左右,實現(xiàn)快速交付。預(yù)制裝配率可達90%,實現(xiàn)4個月建成,17天交裝完畢,解決了傳統(tǒng)數(shù)據(jù)中心建設(shè)周期長、無法滿足業(yè)務(wù)快速上線的問題。
在綠色低碳方面,浪潮信息創(chuàng)新將液冷、光伏、儲能、余熱回收等多種綠色技術(shù)有機結(jié)合,提高散熱及能源利用效率,實現(xiàn)綠色節(jié)能,PUE可降至1.1以下,降低碳排放25%,4個集裝箱(千卡規(guī)模算力)每年可節(jié)省電費 400 萬元。
在靈活性方面,可實現(xiàn)彈性擴容,預(yù)制化AIDC初期根據(jù)資金水平和算力需求按需部署,后期可根據(jù)算力設(shè)備升級擴容。在支持水平擴容的同時,可實現(xiàn)豎向按需擴容,最高可擴容至5層,實現(xiàn)全場景覆蓋。此外,IT、電力、集成冷站、液冷冷源、辦公、走廊、電梯、樓梯等八種功能箱體,可根據(jù)不同場景、規(guī)模靈活組合,并按照功率區(qū)段分區(qū)部署,實現(xiàn)風冷/液冷、AI/通用/高密度等多種形態(tài)靈活兼容,匹配智算算力、通用算力、邊緣算力等多種應(yīng)用場景。
挑戰(zhàn)與機遇并存
未來,預(yù)制化 AIDC 將憑借其快速交付、綠色低碳、高密部署等優(yōu)勢,成為智算中心建設(shè)的主流趨勢。但是浪潮信息預(yù)制化AIDC解決方案發(fā)布的“成長之路”并非是一帆風順的。
在浪潮信息服務(wù)器產(chǎn)品線副總經(jīng)理李金波看來,選擇集裝箱的建設(shè)模式建設(shè)大規(guī)模智算中心,是一個擺在浪潮信息面前的現(xiàn)實難題。規(guī)劃階段需確保其具備靈活擴展能力,實現(xiàn)上層擴建時下層正常運行;建設(shè)過程中如何高效完成集裝箱的拼接、互聯(lián)、確保設(shè)備正常運行以及對于新技術(shù)的融合與創(chuàng)新,都需要不斷摸索。
李金波表示,針對以上難題,浪潮信息技術(shù)團隊深入研究,對集裝箱結(jié)構(gòu)進行優(yōu)化設(shè)計,確保大規(guī)模拼接時的穩(wěn)定性和功能性。由單箱到超大集群,在箱體設(shè)計中采用四柱八梁結(jié)構(gòu),增強梁的承重能力,合理規(guī)劃箱板厚度與保溫性能,充分考慮上層施工時下層的正常使用,能從各方面滿足智算中心使用需求。
此外,對關(guān)鍵技術(shù)持續(xù)攻關(guān),例如,在供配電方面,研發(fā)簡電路供電技術(shù),提升供電效率;在算力節(jié)點大量使用高密智算算力倉,浪潮信息風冷和液冷智算算力倉在全國應(yīng)用密度較高,現(xiàn)能做到50kW的風冷、130kW的液冷。
經(jīng)過在困境之中的不斷探索,如今,浪潮信息預(yù)制化 AIDC方案已從內(nèi)到外具備自身獨特優(yōu)勢,在互聯(lián)網(wǎng)、金融、能源、教科研、汽車等行業(yè)均有落地應(yīng)用。
算力工廠賦能AI應(yīng)用落地
算力是集數(shù)據(jù)傳輸、計算、存儲于一體的新型生產(chǎn)力,更是培育新質(zhì)生產(chǎn)力,推動智能化轉(zhuǎn)型的核心驅(qū)動力。
“大模型如何進一步發(fā)展,就是應(yīng)用落地。”浪潮信息人工智能與高性能產(chǎn)品部副總經(jīng)理張強說道。如今,浪潮信息元腦算力工廠包含了數(shù)據(jù)處理、AI大模型、業(yè)務(wù)應(yīng)用、研發(fā)測試等多個集群,為全球服務(wù)器壓力測試、大模型開發(fā)應(yīng)用、智能化轉(zhuǎn)型等業(yè)務(wù)應(yīng)用提供算力支撐。
張強指出,在推動大模型落地應(yīng)用領(lǐng)域,針對網(wǎng)絡(luò)通信效率瓶頸,元腦算力工廠采用 X400 超級 AI 以太網(wǎng)方案,為大模型訓練提效降本,提升了大規(guī)模GPU訓練性能,成為新型AI訓練網(wǎng)絡(luò)解決方案。其吞吐量51.2T為業(yè)界最高,較前代提升4倍,相比傳統(tǒng)RoCE網(wǎng)絡(luò)性能提升1.6倍,通信時延降低30%,能大幅提升大模型訓練效率,縮短訓練時長并降低訓練成本。
元腦算力工廠搭載企業(yè)大模型開發(fā)平臺“元腦企智”EPAI,連接多元算力、多元模型與應(yīng)用層,實現(xiàn)模型高效微調(diào)與跨平臺無感遷移,加速大模型在各個行業(yè)落地應(yīng)用。同時,元腦算力工廠助力企業(yè)智能化轉(zhuǎn)型,智能編程助手、智能投標助手、智能客服、供應(yīng)鏈大腦、智能工廠等系列智能創(chuàng)新成果相繼落地,賦能業(yè)務(wù)智能化轉(zhuǎn)型。
在提升大模型訓練效率方面,張強向C114介紹,元腦算力工廠通過算力開發(fā)平臺 AIStation 對算力進行有效調(diào)度。在實際算力使用中,AI應(yīng)用有不同算力需求,在這多用戶、多任務(wù)場景下,對算力需求不同,AIStation能對算力集群進行有效調(diào)度,降低成本、提高算力利用率,保障算力集群安全、可靠運行,實現(xiàn)智能、高效、低成本運維。
據(jù)IDC數(shù)據(jù)顯示,受AI影響,從2022年到2026年,中國區(qū)人工智能算力規(guī)模年復(fù)合增長率將達到52.3%,算力需求將迎來更爆發(fā)式增長。元腦算力工廠成為浪潮信息智能化轉(zhuǎn)型重要節(jié)點,未來浪潮信息將依托預(yù)制化 AIDC 方案等智算創(chuàng)新,賦能千行百業(yè),助力企業(yè)實現(xiàn)綠色、高效、智能轉(zhuǎn)型升級。