當(dāng)前,火熱的大模型技術(shù)和面向行業(yè)場(chǎng)景化的創(chuàng)新AI研發(fā),都離不開(kāi)算力資源的有力支撐。進(jìn)入大模型時(shí)代,算力需求日益復(fù)雜,不僅要求算力資源更加充沛和靈活,還要求算力基礎(chǔ)設(shè)施向智能化和一體化的方向發(fā)展,以更高效率和性能來(lái)支持更大規(guī)模計(jì)算。
如何解決智算資源供給矛盾?如何提高算力利用效率?如何讓“計(jì)算”更綠色低碳?中國(guó)電信天翼云給出了答案。
今天,一起走進(jìn)中國(guó)電信京津冀智能算力中心萬(wàn)卡池,看中國(guó)電信天翼云如何擁抱人工智能技術(shù)趨勢(shì),通過(guò)豐富的智算資源供給和一體化的平臺(tái)服務(wù)能力,助力千行百業(yè)向智發(fā)展,為數(shù)字經(jīng)濟(jì)發(fā)展注入新動(dòng)能。
“智能計(jì)算”夯實(shí)算力底座
走進(jìn)中國(guó)電信京津冀智能算力中心,十幾棟黑白相間的建筑整齊排列,機(jī)房、冷卻車(chē)間、應(yīng)急發(fā)電設(shè)備分布其中。來(lái)到機(jī)房里,一排排機(jī)柜鱗次櫛比,五顏六色的數(shù)據(jù)線整齊有序,信號(hào)燈不斷閃爍……大量數(shù)據(jù)信息在這里傳遞、計(jì)算和存儲(chǔ)。
適應(yīng)人工智能發(fā)展趨勢(shì),中國(guó)電信規(guī)劃并建設(shè)全國(guó)“2+3+7+X”公共智算資源池,在京津冀、長(zhǎng)三角地區(qū)建設(shè)兩大國(guó)產(chǎn)液冷單集群萬(wàn)卡智算池。“中國(guó)電信京津冀智能算力中心是業(yè)內(nèi)領(lǐng)先的全國(guó)產(chǎn)化訓(xùn)推一體、基于自研架構(gòu)的液冷高性能公共智算中心,可以承載千億到萬(wàn)億參數(shù)的大模型訓(xùn)練業(yè)務(wù)。”中國(guó)電信京津冀智能算力中心副主任專(zhuān)家趙夢(mèng)麟介紹。
京津冀智能算力中心依托中國(guó)電信“2(2)+4+31+X+O”梯次化云資源布局、空天一體的衛(wèi)星網(wǎng)絡(luò)、全球最大的全光算力網(wǎng)絡(luò),具備以京津冀為中心、全國(guó)可達(dá)的超低時(shí)延圈網(wǎng)絡(luò)優(yōu)勢(shì),北京、天津算力用戶可1ms“一跳入算”接入京津冀智算中心,滿足多場(chǎng)景下科研創(chuàng)新算力和大模型訓(xùn)練所需的高并發(fā)算力需求。中國(guó)電信京津冀智能算力中心重點(diǎn)滿足京津冀及周邊省份的智算業(yè)務(wù)發(fā)展需求,將服務(wù)AI大模型、車(chē)聯(lián)網(wǎng)、互聯(lián)網(wǎng)、生物醫(yī)藥等高新企業(yè),并為政府、企業(yè)、高校等提供公共算力、應(yīng)用創(chuàng)新孵化、產(chǎn)業(yè)聚合發(fā)展、科研創(chuàng)新和人才培養(yǎng)等平臺(tái)服務(wù)。
緊隨人工智能、大模型等產(chǎn)業(yè)發(fā)展方向,中國(guó)電信京津冀智能算力中心持續(xù)提升智能算力承載能力,建設(shè)了國(guó)產(chǎn)自主智能算力萬(wàn)卡資源池,滿足萬(wàn)億參數(shù)大模型預(yù)訓(xùn)練部署要求。“這個(gè)萬(wàn)卡資源池是京津冀地區(qū)目前唯一的擁有萬(wàn)卡國(guó)產(chǎn)芯片的智能算力中心,能夠?yàn)檎麄€(gè)京津冀地區(qū)的大模型客戶提供充沛的算力供給。”趙夢(mèng)麟介紹。
據(jù)了解,萬(wàn)卡資源池依托天翼云自主研發(fā)的“息壤”一體化智算服務(wù)平臺(tái),實(shí)現(xiàn)萬(wàn)卡資源納管和萬(wàn)卡規(guī)模并行訓(xùn)練。“息壤”能夠提供單集群萬(wàn)卡國(guó)產(chǎn)化全功能預(yù)訓(xùn)練服務(wù),采用自適應(yīng)并行策略,多項(xiàng)技術(shù)突破實(shí)現(xiàn)萬(wàn)卡長(zhǎng)效穩(wěn)定訓(xùn)練,MFU達(dá)到國(guó)內(nèi)領(lǐng)先水平,能夠滿足各種算力應(yīng)用場(chǎng)景及各種不同客戶的算力需求,適用于千億/萬(wàn)億級(jí)參數(shù)規(guī)模大語(yǔ)言模型訓(xùn)練,如Llama 3、Qwen等超大規(guī)模語(yǔ)言模型,以及多模態(tài)模型開(kāi)發(fā)、虛擬現(xiàn)實(shí)與元宇宙等。
萬(wàn)卡資源池將為廣大企業(yè)提供高效、穩(wěn)定、安全的一站式智算服務(wù),支持企業(yè)數(shù)字化轉(zhuǎn)型和智能化升級(jí)。國(guó)產(chǎn)算力資源將賦能智慧城市建設(shè)、公共服務(wù)優(yōu)化等應(yīng)用場(chǎng)景,提高政府治理能力和公共服務(wù)水平。
未來(lái),根據(jù)業(yè)務(wù)發(fā)展需要,中國(guó)電信京津冀智算能力中心將持續(xù)提升一體化智算服務(wù)平臺(tái)整體效能,不斷培育完善國(guó)產(chǎn)化智算生態(tài)系統(tǒng),賦能更多行業(yè)、企業(yè),助力實(shí)體經(jīng)濟(jì)與數(shù)字經(jīng)濟(jì)深度融合。
“綠色計(jì)算”助力可持續(xù)發(fā)展
數(shù)據(jù)中心是耗能大戶,也是節(jié)能降碳的核心發(fā)力領(lǐng)域之一。據(jù)國(guó)網(wǎng)能源研究院預(yù)測(cè),到2030年,我國(guó)數(shù)據(jù)中心用電量會(huì)突破4000億千瓦時(shí),占全社會(huì)用電量的比重達(dá)3.7%。為了解決數(shù)據(jù)中心高能耗以及算力需求激增的矛盾,“綠色計(jì)算”是大勢(shì)所趨。
作為京津冀地區(qū)最大的綠色算力中心,中國(guó)電信京津冀智能算力中心在探索綠色發(fā)展模式的過(guò)程中做了哪些努力呢?
走進(jìn)京津冀智能算力中心的冷站,首先映入眼簾的是色彩分明的供水管路。通過(guò)這些黃色、綠色、紅色、藍(lán)色的管道,空調(diào)用水實(shí)現(xiàn)了高效循環(huán),服務(wù)器運(yùn)行過(guò)程中產(chǎn)生的熱量通過(guò)精心設(shè)計(jì)的水冷系統(tǒng)得到釋放,從而保障服務(wù)器平穩(wěn)運(yùn)轉(zhuǎn)。
“滿足高密度、高功率的智算服務(wù)器的供冷需求,是智能算力中心建設(shè)過(guò)程中的一個(gè)難點(diǎn)。”來(lái)到智能算力彈性方艙,趙夢(mèng)麟介紹了目前天翼云萬(wàn)卡資源池所采用的冷板式液冷技術(shù)。冷板式液冷是通過(guò)冷板(通常為銅鋁等導(dǎo)熱金屬構(gòu)成的封閉腔體)將發(fā)熱器件的熱量間接傳遞給封閉在循環(huán)管路中的冷卻液體,通過(guò)冷卻液體將熱量帶走的一種實(shí)現(xiàn)形式,它可以精準(zhǔn)定位CPU、GPU的發(fā)熱點(diǎn)進(jìn)行冷卻,實(shí)現(xiàn)高效散熱。冷板式液冷通過(guò)冷卻塔進(jìn)行換熱,能夠冷卻70%~80%的服務(wù)器發(fā)熱量,剩余20%~30%的發(fā)熱量通過(guò)冷凍水補(bǔ)冷方式冷卻。由于液冷系統(tǒng)不需要使用風(fēng)扇等機(jī)械設(shè)備進(jìn)行散熱,因此能夠顯著降低噪聲,并減少服務(wù)器的能耗,有助于實(shí)現(xiàn)數(shù)據(jù)中心的綠色轉(zhuǎn)型,降低運(yùn)營(yíng)成本。
“冷板式液冷技術(shù)的應(yīng)用不僅提升了算力規(guī)模,還提高了算力服務(wù)的質(zhì)量。通過(guò)降低服務(wù)器的運(yùn)行溫度和散熱噪聲,改善了算力中心的工作環(huán)境,提高了工作人員的舒適度和工作效率。”趙夢(mèng)麟介紹,根據(jù)估算,采用冷板式液冷技術(shù),年節(jié)約用電量可達(dá)億千瓦時(shí),減少的二氧化碳排放量也相當(dāng)可觀。“經(jīng)計(jì)算,采用冷板式液冷技術(shù)的萬(wàn)卡資源池全年P(guān)UE值為1.15,單位算力能耗為1.5kW/P。”
智能的算力,綠色的算力。面向云智融合的時(shí)代趨勢(shì),作為云服務(wù)國(guó)家隊(duì)的天翼云勇?lián)鷷r(shí)代重任,打造多層次的算力布局,將通過(guò)豐富的智算資源供給,充分發(fā)揮“息壤”一體化智算服務(wù)平臺(tái)作用,提供綠色、高效的智算服務(wù),持續(xù)為全社會(huì)的智能化轉(zhuǎn)型升級(jí)增添動(dòng)能。
中國(guó)電信京津冀智能算力中心。
中國(guó)電信京津冀智能算力中心萬(wàn)卡池機(jī)房。
中國(guó)電信京津冀智能算力中心冷站。