訂閱
糾錯(cuò)
加入自媒體

華為云地協(xié)同方案加速網(wǎng)絡(luò)AI規(guī)模應(yīng)用

2020-09-27 09:14
IT168
關(guān)注

人工智能經(jīng)歷了六十多年的浮浮沉沉,隨著計(jì)算算力的進(jìn)步,算法的創(chuàng)新和互聯(lián)網(wǎng)發(fā)展下的海量數(shù)據(jù)積累,人工智能技術(shù)未來十年將煥發(fā)出新的活力,成為最具有沖擊力的科技發(fā)展趨勢之一。

電信網(wǎng)絡(luò)作為信息通信的基礎(chǔ)設(shè)施,具有應(yīng)用人工智能技術(shù)的巨大空間和潛力。如何利用人工智能算法提供的強(qiáng)大分析、判斷、預(yù)測等能力,賦能網(wǎng)元、網(wǎng)絡(luò)和業(yè)務(wù)系統(tǒng),并將其與電信網(wǎng)絡(luò)的規(guī)劃、建設(shè)、維護(hù)、運(yùn)行和優(yōu)化等工作內(nèi)容結(jié)合起來,成為電信業(yè)關(guān)注的重要課題。

在HUAWEI CONNECT 2020期間,華為基于對電信領(lǐng)域的深刻理解和多年經(jīng)驗(yàn)沉淀,帶來了《云地協(xié)同加速網(wǎng)絡(luò)AI規(guī)模商用使能實(shí)現(xiàn)自動(dòng)駕駛網(wǎng)絡(luò)》的分享,旨在結(jié)合電信領(lǐng)域應(yīng)用場景,使能網(wǎng)絡(luò)達(dá)到自動(dòng)、自愈、自優(yōu)和自治的自動(dòng)駕駛網(wǎng)絡(luò),提升整個(gè)網(wǎng)絡(luò)的效率,降低OPEX。

電信行業(yè)面臨挑戰(zhàn)呼喚ADN

我們正進(jìn)入一個(gè)跨界競爭的新時(shí)代,每個(gè)行業(yè)都面臨著結(jié)構(gòu)性挑戰(zhàn),電信行業(yè)尤其如此。新趨勢下,電信網(wǎng)絡(luò)正面臨以下三大挑戰(zhàn):

業(yè)務(wù)復(fù)雜:網(wǎng)絡(luò)所聯(lián)接的業(yè)務(wù)越來越多,無人機(jī)、汽車、AR/VR…從B2C到B2C、B2X,網(wǎng)絡(luò)所支撐的業(yè)務(wù)越來越復(fù)雜;

運(yùn)維復(fù)雜:從4G到5G,2-3-4-5四代同堂,十余種網(wǎng)絡(luò)協(xié)議,數(shù)千網(wǎng)絡(luò)特性,上萬配置參數(shù),網(wǎng)絡(luò)運(yùn)維復(fù)雜度激增;

聯(lián)接復(fù)雜:萬物智能,使得聯(lián)接密度增加了100倍,聯(lián)接移動(dòng)性達(dá)到了150km/h,聯(lián)接的數(shù)據(jù)量增加1000倍,聯(lián)接復(fù)雜度前所未有;

要解決電信網(wǎng)絡(luò)面臨的挑戰(zhàn),僅僅靠產(chǎn)品創(chuàng)新遠(yuǎn)遠(yuǎn)不夠,需要整個(gè)系統(tǒng)架構(gòu)創(chuàng)新和商業(yè)模式創(chuàng)新,才能提升運(yùn)營商的競爭力,解決結(jié)構(gòu)性問題。從2018年開始,為實(shí)現(xiàn)網(wǎng)絡(luò)自動(dòng)化和智能化,電信行業(yè)組織、運(yùn)營商和設(shè)備商紛紛啟動(dòng)技術(shù)探索。

華為在2018年即提出電信行業(yè)邁向ADN五級演進(jìn)標(biāo)準(zhǔn),為實(shí)現(xiàn)自動(dòng)駕駛網(wǎng)絡(luò)提供了參考。另外,以中國聯(lián)通、中國移動(dòng)、BT、法電、Telstra為代表的運(yùn)營商,以及以華為、愛立信為代表的設(shè)備供應(yīng)商均積極開展相關(guān)實(shí)踐,網(wǎng)絡(luò)智能化、自動(dòng)化成為行業(yè)熱點(diǎn)。

近10年來,華為從ALL IP,ALL Cloud進(jìn)入ALL Intelligence時(shí)代,在架構(gòu)創(chuàng)新的道路上從未停止。2019年4月,華為正式發(fā)布iMaster NAIE網(wǎng)絡(luò)AI云服務(wù),為華為網(wǎng)絡(luò)智能化戰(zhàn)略實(shí)施的的重要里程碑。

不僅如此,華為自動(dòng)駕駛網(wǎng)絡(luò)(ADN)秉承“把復(fù)雜留給自己,把簡單帶給客戶”的思想,以網(wǎng)絡(luò)極簡和智能運(yùn)維為核心理念規(guī)劃、設(shè)計(jì)和開發(fā)產(chǎn)品,通過云端+AI、網(wǎng)絡(luò)+AI和網(wǎng)元+AI的三層AI開放架構(gòu)“給網(wǎng)絡(luò)以智能,給運(yùn)維以平臺”,加速電信運(yùn)營商數(shù)字化和智能化轉(zhuǎn)型。

云地協(xié)同加速AI特性規(guī)模應(yīng)用

近年來,全球業(yè)界各方在網(wǎng)絡(luò)AI方面紛紛進(jìn)行積極的探索和實(shí)踐,經(jīng)過驗(yàn)證在運(yùn)維效率、能耗效率、網(wǎng)絡(luò)資源利用率以及用戶業(yè)務(wù)體驗(yàn)提升等方面確實(shí)能夠帶來價(jià)值,電信產(chǎn)業(yè)走向智能化已經(jīng)成為整個(gè)行業(yè)的共識。但在實(shí)踐中,也發(fā)現(xiàn)網(wǎng)絡(luò)AI在走向規(guī);こ虘(yīng)用的過程中存在很多挑戰(zhàn),如模型重訓(xùn)練占用資源多、模型版本升級管理難度大、本地樣本少、模型精度不夠等問題。

模型重訓(xùn)練占用資源多:從實(shí)踐統(tǒng)計(jì)來看,一些場景都會(huì)發(fā)生因泛化、或數(shù)據(jù)偏移而導(dǎo)致的模型精度下降問題,如無線流量預(yù)測、DC PUE優(yōu)化等,AI模型都需要進(jìn)行重訓(xùn)練。AI模型訓(xùn)練一般會(huì)占用較多系統(tǒng)資源,如在網(wǎng)元或網(wǎng)管實(shí)施重訓(xùn)練任務(wù),訓(xùn)練效率低,同時(shí)也可能會(huì)影響設(shè)備性能。

模型版本升級管理難度大:很多場景的AI模型都是一站一模型,如無線基站智能節(jié)能等,各站點(diǎn)的模型都根據(jù)本地化數(shù)據(jù)進(jìn)行定制化訓(xùn)練。各局點(diǎn)模型版本不同,升級頻度也不同,成千上萬的站點(diǎn)模型,管理難度很大。需要有一個(gè)統(tǒng)一的平臺,高效實(shí)現(xiàn)模型狀態(tài)的監(jiān)控和版本升級策略等管理任務(wù)。

本地樣本少、模型精度不夠:部分場景單局點(diǎn)樣本量少,不足以支撐模型訓(xùn)練,如核心網(wǎng)KPI異常檢測,單局點(diǎn)發(fā)生異常頻率很少,訓(xùn)練需要的樣本量不夠。因此,需要能夠匯聚所有局點(diǎn)的全量樣本信息,可能還需輔以聯(lián)邦學(xué)習(xí)等技術(shù),才能訓(xùn)練得到滿足業(yè)務(wù)精度要求的AI模型。

云地協(xié)同實(shí)現(xiàn)架構(gòu)

針對以上問題,華為提出云地協(xié)同創(chuàng)新方案,通過云地協(xié)同,可以加速AI特性的規(guī)模部署。

云地協(xié)同,是指云端和地端一起協(xié)作完成數(shù)據(jù)樣本上云,模型狀態(tài)管理,模型重訓(xùn)練,模型/知識下發(fā)、擇優(yōu)更新等一系列的閉環(huán)任務(wù),同時(shí)把云端匯集的全局網(wǎng)絡(luò)知識經(jīng)驗(yàn)、全量數(shù)據(jù)訓(xùn)練得到的高精度模型,持續(xù)注入地端,讓電信網(wǎng)絡(luò)能夠進(jìn)行智能的迭代升級,變得越來越聰明。

云地協(xié)同有三個(gè)主要的特征:一是云端和地端要有通道;二是地端到云端,信息可以從運(yùn)營商上傳到云端,包括數(shù)據(jù)樣本、模型狀態(tài)、以及重訓(xùn)練請求等信息,三是云端到地端可以下發(fā)新的模型,同時(shí)網(wǎng)絡(luò)知識庫里的知識也可以注入到地端。

云地協(xié)同機(jī)制參見下圖:

云地協(xié)同三個(gè)階段

據(jù)介紹,云地協(xié)同在實(shí)際應(yīng)用部署時(shí)有三個(gè)階段,針對不同場景可以選擇適合的階段,最終大幅提高網(wǎng)絡(luò)的資源效率。

階段1:云端進(jìn)行初始模型的訓(xùn)練,運(yùn)行態(tài)由地端根據(jù)新增的樣本進(jìn)行在線學(xué)習(xí),持續(xù)保持模型的精度。這種模式主要是適用于模型相對簡單,算法結(jié)構(gòu)比較穩(wěn)定的場景,這種場景一般不需要對模型結(jié)構(gòu)和算法本身進(jìn)行更改,只需要根據(jù)本地?cái)?shù)據(jù)進(jìn)行在線學(xué)習(xí),優(yōu)化調(diào)整模型參數(shù)。比如像核心網(wǎng)變更在線機(jī)器值守等。

階段2:云端進(jìn)行模型的分發(fā),然后在地端根據(jù)新增樣本進(jìn)行在線學(xué)習(xí)。具體講,就是云端會(huì)持續(xù)對模型進(jìn)行優(yōu)化,包括模型算法結(jié)構(gòu)上的,優(yōu)化后的模型會(huì)進(jìn)行推送到地端,地端根據(jù)評估結(jié)果進(jìn)行模型擇優(yōu)更新。同時(shí),地端也會(huì)根據(jù)本地?cái)?shù)據(jù)樣本的學(xué)習(xí)進(jìn)行模型參數(shù)的優(yōu)化。這種一般適合于模型相對復(fù)雜,華為會(huì)持續(xù)進(jìn)行模型算法結(jié)構(gòu)優(yōu)化的場景,比如無線KPI 異常檢測等。

階段3:云地實(shí)時(shí)協(xié)同,模型可以自動(dòng)化演進(jìn),具體講就是本地樣本會(huì)實(shí)時(shí)上傳到云端,云端進(jìn)行訓(xùn)練和優(yōu)化后的模型會(huì)自動(dòng)推送到地端,地端進(jìn)行模型評估擇優(yōu)進(jìn)行升級。這種主要是適用于模型復(fù)雜、需要用到華為云端高質(zhì)量標(biāo)注數(shù)據(jù),知識圖譜以及仿真等知識能力進(jìn)行模型優(yōu)化的場景,比如IP RAN/PTN智能告警,DC PUE優(yōu)化等。

云地協(xié)同關(guān)鍵價(jià)值

聯(lián)邦學(xué)習(xí),即通過匯聚各個(gè)地端模型的參數(shù),在云端采用匯聚算法,形成效果更好的共享模型,再下發(fā)給各個(gè)地端進(jìn)行使用,其最大的特點(diǎn),就是在地端數(shù)據(jù)不用出局的情況下,提升模型的精度。借助聯(lián)邦學(xué)習(xí)可以更好的實(shí)現(xiàn)云地協(xié)同,從而提升模型泛化能力和訓(xùn)練效率。

借助知識圖譜,通過沉淀專家經(jīng)驗(yàn)和產(chǎn)品知識轉(zhuǎn)化形成故障傳播關(guān)系等,形成“網(wǎng)絡(luò)知識庫”,可用于故障運(yùn)維輔助、知識問答等。

在云端仿真方面,通過在云端構(gòu)建虛擬仿真環(huán)境,高效安全地進(jìn)行模型或業(yè)務(wù)驗(yàn)證,在避免現(xiàn)網(wǎng)性能或KPI受到影響的同時(shí),支撐網(wǎng)絡(luò)問題的快速閉環(huán)。

模型因?yàn)樾枰M(jìn)行更新,更新的方式如果采用傳統(tǒng)網(wǎng)管集成的這種模式,需要經(jīng)過多層多次的人工動(dòng)作,首先模型版本發(fā)布后,需要產(chǎn)品研發(fā)把模型通過代碼工作集成到網(wǎng)管軟件版本里,然后發(fā)布到華為Support網(wǎng)站。

如果采用自動(dòng)升級模式,通過云地協(xié)同,讓AI模型市場跟地端網(wǎng)絡(luò)AI對接,模型發(fā)布后進(jìn)行推送,讓地端局點(diǎn)啟動(dòng)自動(dòng)化的模型升級,當(dāng)然升級前也會(huì)完成模型的評估,整個(gè)過程在1個(gè)小時(shí)即可完成。

總結(jié)來看,云地協(xié)同可以實(shí)現(xiàn)一點(diǎn)生效,全網(wǎng)復(fù)制,AI的特性在一個(gè)局點(diǎn)成功實(shí)施后,快速的形成知識和經(jīng)驗(yàn),在其他局點(diǎn)進(jìn)行復(fù)制,實(shí)現(xiàn)在全網(wǎng)規(guī)模應(yīng)用。

華為iMaster NAIE讓網(wǎng)絡(luò)AI開發(fā)簡單高效

NAIE是自動(dòng)駕駛網(wǎng)絡(luò)解決方案的網(wǎng)絡(luò)AI設(shè)計(jì)和開發(fā)平臺,由數(shù)據(jù)服務(wù),訓(xùn)練服務(wù),AIOps使能服務(wù),推理框架和生態(tài)服務(wù)五大部分組成。

網(wǎng)絡(luò)AI模型開發(fā)既要懂AI、又要懂網(wǎng)絡(luò),技術(shù)門檻高。模型開發(fā)過程中,既需要懂AI知識,又需要熟悉網(wǎng)絡(luò)業(yè)務(wù)。電信領(lǐng)域?qū)<褹I積累少,可借鑒經(jīng)驗(yàn)少。而且由于AI算法多,選擇范圍廣,所以導(dǎo)致試錯(cuò)成本高、開發(fā)效率低;算法科學(xué)家不懂電信業(yè)務(wù),需要花大量時(shí)間了解學(xué)習(xí)。模型訓(xùn)練依賴大量并且昂貴的計(jì)算資源,調(diào)參優(yōu)化周期長,訓(xùn)練耗時(shí)高、周期長。

NAIE訓(xùn)練平臺,提供一站式高效模型訓(xùn)練,集成業(yè)界通用的主流AI算法框架,包括Mindspore、Tensorflow、SParkML、Caffe2、MXNet等,內(nèi)嵌華為在網(wǎng)絡(luò)領(lǐng)域30多年的知識和經(jīng)驗(yàn)沉淀,支持電信領(lǐng)域的特征處理,輔助快速識別等關(guān)鍵特征,內(nèi)置電信領(lǐng)域AI典型算法,如異常檢測、根因分析、優(yōu)化控制、業(yè)務(wù)預(yù)測等,支持模型快速驗(yàn)證。目前主要包括三類服務(wù):模型訓(xùn)練服務(wù)、模型生成服務(wù)和通信模型服務(wù)(在線推理),可以滿足不同層次的人員對于模型開發(fā)的需求。

不僅如此,華為還提供了豐富的NAIE培訓(xùn)服務(wù),線上線下結(jié)合,助力運(yùn)營商人才轉(zhuǎn)型。

總結(jié)

未來是智能化的時(shí)代,運(yùn)營商網(wǎng)絡(luò)智能化不可能一蹴而就,而是一個(gè)長期實(shí)踐。華為自動(dòng)駕駛網(wǎng)絡(luò)解決方案是華為All Intelligence戰(zhàn)略在電信領(lǐng)域的落地,而iMaster NAIE做為智能化部件,將使能自動(dòng)駕駛網(wǎng)絡(luò)。核心的AI能力依托華為在All Intelligence中長期堅(jiān)決的戰(zhàn)略投入而積累成長,和電信領(lǐng)域場景想結(jié)合,幫助運(yùn)營商盡快實(shí)現(xiàn)數(shù)字化,智能化轉(zhuǎn)型。

作者:陶然編輯: 陶然來源:IT168網(wǎng)站  原創(chuàng)

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號