在陽(yáng)泉,探密百度AI“心臟”
二 心臟到底有多強(qiáng)?
走進(jìn)百度陽(yáng)泉云計(jì)算中心的機(jī)房之內(nèi),就會(huì)發(fā)現(xiàn)一排排機(jī)柜統(tǒng)一排列,機(jī)柜上的服務(wù)器的風(fēng)扇聲嗡嗡作響。機(jī)房的溫度明顯比室外高了一截。
這是百度“心臟”的聲音與溫度。百度的“心臟”到底有多強(qiáng),我們可以從這幾個(gè)維度來(lái)進(jìn)行解析。
1、性能和效率
“心臟”想要跳的快,一方面需要“心臟”本身有力度,另外一方面則是需要血管供血足。對(duì)AI的“心臟”來(lái)說(shuō)則是兩個(gè)點(diǎn),一是算力強(qiáng),另一方面也要數(shù)據(jù)傳輸快。
百度陽(yáng)泉云計(jì)算中心目前已上線服務(wù)器超過(guò)15萬(wàn)臺(tái)。包括了天蝎整機(jī)柜服務(wù)器、“冰山”冷存儲(chǔ)服務(wù)器、X-MAN超級(jí)AI計(jì)算平臺(tái)等多種百度自研計(jì)算系統(tǒng)。像去年年底百度最新發(fā)布AI計(jì)算平臺(tái)X-MAN3.0每秒可完成2000萬(wàn)億次深度神經(jīng)網(wǎng)絡(luò)計(jì)算。這種強(qiáng)大的計(jì)算能力都是為了適應(yīng)AI時(shí)代的運(yùn)算要求。
為這種強(qiáng)大算力“供血”的“血管”則是百度自主研發(fā)高性能交換機(jī)。提供超大規(guī)模的網(wǎng)絡(luò)吞吐,支持10G、25G的通用計(jì)算網(wǎng)絡(luò)接入和100G的AI高速無(wú)損網(wǎng)絡(luò)互聯(lián)技術(shù)。百度通過(guò)大帶寬、低時(shí)延、無(wú)損網(wǎng)絡(luò),讓數(shù)據(jù)中心數(shù)十萬(wàn)臺(tái)服務(wù)器連接成了一個(gè)超級(jí)計(jì)算機(jī)。
2、容災(zāi)和備災(zāi)
“心臟”作為人最重要的器官當(dāng)然一刻都不能停止,數(shù)據(jù)中心作為心臟當(dāng)然也不能停。云計(jì)算中心里設(shè)備價(jià)格昂貴,一旦發(fā)生不可預(yù)知的災(zāi)難,對(duì)企業(yè)將造成嚴(yán)重?fù)p失。設(shè)備損壞等有形的損失可以彌補(bǔ),而寶貴的數(shù)據(jù)丟失造成的損失則是無(wú)法計(jì)算的。
在移動(dòng)互聯(lián)網(wǎng)時(shí)代,一個(gè)數(shù)據(jù)中心的服務(wù)器一旦出現(xiàn)短時(shí)間抖動(dòng),就會(huì)導(dǎo)致刷不了淘寶、付不了支付寶,在全網(wǎng)產(chǎn)生討論。
AI時(shí)代服務(wù)器出問(wèn)題,可能會(huì)導(dǎo)致自動(dòng)駕駛車(chē)輛失控,鋼鐵能源工業(yè)客戶(hù)面臨數(shù)以?xún)|計(jì)的經(jīng)濟(jì)損失。
因此,數(shù)據(jù)中心的容災(zāi)備災(zāi)顯得及其重要。而百度陽(yáng)泉云計(jì)算中心通過(guò)AI控制,數(shù)據(jù)中心的運(yùn)維從人工走向智能,可以實(shí)現(xiàn)大數(shù)據(jù)分析和診斷,迅速縮短故障維修時(shí)間。過(guò)去30分鐘的網(wǎng)絡(luò)故障排查直接縮減到了5分鐘。
當(dāng)問(wèn)到一旦出現(xiàn)自然災(zāi)害、意外火災(zāi)等極端意外情況下百度陽(yáng)泉云計(jì)算中心要如何應(yīng)對(duì)時(shí),百度系統(tǒng)部總監(jiān)張炳華提到:
從業(yè)務(wù)部署角度,百度數(shù)據(jù)中心計(jì)算資源采用了N+1的冗余設(shè)計(jì),用戶(hù)的流量有多個(gè)入口,可以繞道其他數(shù)據(jù)中心。在入口層面也有一套智能調(diào)度的系統(tǒng)。
百度內(nèi)部甚至做過(guò)這樣一個(gè)極端測(cè)試——關(guān)掉任何一個(gè)數(shù)據(jù)中心,用戶(hù)端也不會(huì)有任何感知,服務(wù)也不會(huì)受到任何影響。
我簡(jiǎn)單翻譯一下這段話。大概相當(dāng)于百度有好幾顆“心臟”,即使是一顆“心臟“出現(xiàn)故障,其他心臟也可以在故障的那一瞬間隨時(shí)頂上。
事實(shí)上,截止4月8日,百度陽(yáng)泉云計(jì)算中心已安全運(yùn)行1744天。目前也還尚未遇到這些極端意外情況。
3、能耗和環(huán)保
某種意義上說(shuō),科技企業(yè)也是高能耗企業(yè)。因?yàn)辇嫶蟮姆⻊?wù)器群組每天處理各種數(shù)據(jù),產(chǎn)生了龐大的能源消耗。
國(guó)家層面在今年9月發(fā)布了《關(guān)于加強(qiáng)綠色云計(jì)算中心建設(shè)的指導(dǎo)意見(jiàn)》,提出到2022年全國(guó)新建大型、超大型云計(jì)算中心PUE(云計(jì)算中心總設(shè)備能耗/IT設(shè)備能耗,越接近1表明能效越高,是云計(jì)算中心領(lǐng)域衡量能源效率的權(quán)威指標(biāo))需達(dá)到1.4以下。
這個(gè)指導(dǎo)意見(jiàn)的目的在于逼迫科技企業(yè)提高自身技術(shù),做到節(jié)能環(huán)保。
2018年8月,Uptime Institute發(fā)布的《2018數(shù)據(jù)中心調(diào)查報(bào)告》顯示2018年全球數(shù)據(jù)中心PUE為1.58。
阿里所有自研云計(jì)算中心平均PUE已經(jīng)低于1.3,即使是谷歌業(yè)務(wù)關(guān)鍵應(yīng)用和廣告系統(tǒng)也都運(yùn)行在PUE 1.2的云計(jì)算中心上。
令人意外的是,百度陽(yáng)泉云計(jì)算中心的PUE突破了1.10,達(dá)到1.09,能源效率國(guó)內(nèi)第一,每年可節(jié)電量可達(dá)2.5億度,相當(dāng)于13萬(wàn)戶(hù)居民一年的用電量。
三 為AI+5G+I(xiàn)oT未雨綢繆
百度陽(yáng)泉云計(jì)算中心可以說(shuō)是目前國(guó)內(nèi)云計(jì)算中心的頂級(jí)水準(zhǔn),而且和百度目前的AI戰(zhàn)略以及面向未來(lái)的業(yè)務(wù)布局高度匹配。
我曾在《春晚紅包宕機(jī)史,也是半部中國(guó)互聯(lián)網(wǎng)技術(shù)進(jìn)步史》中提到:
春晚的流量規(guī)模,未來(lái)可能正是5G和IoT時(shí)代的“常規(guī)需求”。提前排兵布陣,百利無(wú)一害。
2017年,微軟CEO納德拉在曾經(jīng)提到過(guò)一個(gè)信息,在1992年互聯(lián)網(wǎng)每天流量總量是100G。今天一個(gè)手機(jī)就能存下所有的數(shù)據(jù)。
服務(wù)器和計(jì)算中心的算力、存儲(chǔ)進(jìn)化史,其實(shí)也是世界互聯(lián)網(wǎng)的技術(shù)進(jìn)步史;ヂ(lián)網(wǎng)的發(fā)展,伴隨著IT算力、存儲(chǔ)能力的指數(shù)級(jí)提升。
2018年全球有70億臺(tái)IoT 設(shè)備,有機(jī)構(gòu)預(yù)測(cè)到2020年全球?qū)⒂?00億臺(tái)設(shè)備同時(shí)連接網(wǎng)絡(luò),2023年則是有790億設(shè)備連接到物聯(lián)網(wǎng)。5G時(shí)代流量每小時(shí)所產(chǎn)生的數(shù)據(jù)高達(dá)數(shù)百GB,預(yù)計(jì)將處理比4G多1000倍的數(shù)據(jù)。
當(dāng)代哲學(xué)家西閃在《國(guó)家的計(jì)算》中對(duì)計(jì)算有過(guò)這樣一個(gè)論述:
在現(xiàn)實(shí)世界的“賭局”中,帕斯卡的上帝已經(jīng)隱退,取而代之的,是作為信仰的“未來(lái)”。它像一個(gè)永恒的獎(jiǎng)杯,在時(shí)間的盡頭閃閃發(fā)光。而計(jì)算則取代了程式化的行為訓(xùn)練,演變成為一種新的思維習(xí)慣。
百度作為一家面向AI的企業(yè),它的業(yè)務(wù)同樣無(wú)處不體現(xiàn)著計(jì)算的魅力——信息流、智能云、無(wú)人車(chē)……所有數(shù)據(jù)都要經(jīng)過(guò)服務(wù)器存儲(chǔ)、計(jì)算、傳輸,最終實(shí)現(xiàn)業(yè)務(wù)落地。
百度陽(yáng)泉云計(jì)算中心恰恰是在為AI+5G+I(xiàn)oT時(shí)代做準(zhǔn)備。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
-
10 月之暗面,絕地反擊
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?