訂閱
糾錯
加入自媒體

AI探險日記:乘上星際飛船探索AI宇宙

此外,飛槳的工程師建議,因為采集端只有一路視頻,所以,后端處理業(yè)務(wù)要既保證性能穩(wěn)定性,又能兼顧將來業(yè)務(wù)擴(kuò)展,疊加更多的智能分析功能。新的設(shè)備上線后,每日3公里巡檢2次,單次僅僅能積累約200張圖片素材,為了提高識別精度和更多數(shù)據(jù)的訓(xùn)練積累,飛槳工程師建議對于巡檢點(diǎn)的視頻進(jìn)行截圖回傳,這樣可以增加數(shù)據(jù),再結(jié)合自動和人工標(biāo)注加入訓(xùn)練集,提高識別效率。

“在飛槳的幫助下,我們?nèi)鞒虒W(xué)習(xí)了一次AI的實施落地。我們發(fā)現(xiàn),飛槳的一大優(yōu)點(diǎn)就是開發(fā)部署的學(xué)習(xí)難度很低,即使我們的工程師經(jīng)驗并不豐富,但由于飛槳的開發(fā)套件成熟度高,實際上比我們預(yù)料的上線時間縮短70%以上,這大大的增加了我們以后進(jìn)一步利用AI來改造設(shè)備的勇氣。我們希望把那些單價上億的自動采煤機(jī),都通過百度的AI升級成智能機(jī)器人”,高強(qiáng)博士說:“以前我們說自己是一家機(jī)器人公司,但現(xiàn)在我們可以說自己是一家智能機(jī)器人公司,兩字之差,跨越了一個時代!”

事實上,這種團(tuán)隊規(guī)模中等、有一定技術(shù)底蘊(yùn)的團(tuán)隊,比之前文所說的“先行者模式”,更容易接受像開發(fā)套件這樣的“重武器”,從而提升整體戰(zhàn)斗力,從一個“工作坊”變成企業(yè)的AI發(fā)動機(jī)。

但并不是每個“工作坊”都有完備的團(tuán)隊,吳甜回憶過一個工業(yè)企業(yè)的AI落地情景,當(dāng)初接洽時,初步了解到對方已經(jīng)有一支12人的隊伍,覺得大有希望——這是典型的“工作坊”式團(tuán)隊啊。

然而,經(jīng)過實際接觸才發(fā)現(xiàn),這個12個人的AI團(tuán)隊,只有1名AI專業(yè)研發(fā)人員能夠理解深度學(xué)習(xí)算法的大致原理,并且達(dá)到了能自己動手使用飛槳算法類套件進(jìn)行深度學(xué)習(xí)算法訓(xùn)練的程度。

如何最快的讓這些沒有AI背景、甚至沒有計算機(jī)背景的工程師能夠在AI研發(fā)中形成合力?顯然,從頭學(xué)習(xí)是不現(xiàn)實的,而必須有工具。

被稱為產(chǎn)業(yè)級深度學(xué)習(xí)平臺的飛槳,之所以能夠異軍突起,在短短5年的時間內(nèi),在中國深度學(xué)習(xí)平臺的市場綜合份額上超過谷歌和Facebook,靠的就是和中國產(chǎn)業(yè)界的高度適配。

就拿剛才的問題來說,同一支團(tuán)隊、不同背景、不同經(jīng)驗甚至不同悟性,飛槳都準(zhǔn)備了不同的工具。通過模型研發(fā)深度的階梯式、多層次產(chǎn)品,來應(yīng)對企業(yè)團(tuán)隊中人員背景多樣的問題。

在一次論壇分享中,吳甜自信的說:“無論企業(yè)研發(fā)團(tuán)隊中的能力和經(jīng)驗如何,總能在飛槳平臺上找到一種當(dāng)前適用的產(chǎn)品形態(tài),并可以不斷學(xué)習(xí)精進(jìn),逐漸攀升使用更靈活更自主的產(chǎn)品。”

簡單來說,飛槳平臺就相當(dāng)于一個巨大的模型工廠,能直接基于框架開發(fā)模型的AI工作者,是最高階的,相當(dāng)于米其林的三星級大廚。

僅僅有“工廠”還不夠,還得有具體的“產(chǎn)品線”,這其中,又可以分為場景類開發(fā)套件和算法類開發(fā)套件,來適配不同的應(yīng)用環(huán)境,能夠運(yùn)用開發(fā)套件的,也是AI應(yīng)用人員中的行家里手。

當(dāng)然,對于AI基礎(chǔ)薄弱的人員,尤其是沒有系統(tǒng)的學(xué)過編程的人員來說,最便捷的方式就是無代碼的開發(fā)方式。同樣以“模型工廠”里的大量模型為從基礎(chǔ),飛槳提供了前面介紹過的EasyDL。你可以理解為像使用美圖秀秀這樣簡單,只要做一些拖拽、填寫一些參數(shù)、上傳一些數(shù)據(jù),甚至不用寫一行代碼,就可以快速上手AI開發(fā),吳甜曾稱之為“讓大家找找AI開發(fā)的感覺”。

為了包容不同類型的開發(fā)者,飛槳在便利性上做足功夫。

飛槳封裝隱藏了編譯自定義算子過程中不必要的框架底層概念,并且打通了訓(xùn)練和推理體系,這樣就可以讓更多非AI專業(yè)人員通過飛槳平臺更靈活、更簡單地在自己的領(lǐng)域應(yīng)用深度學(xué)習(xí)技術(shù)。

言歸正傳,說到前面那支背景多樣的團(tuán)隊,在百度飛槳和團(tuán)隊帶頭人的持續(xù)幫助下,能力有了全面的提升,使得團(tuán)隊的技術(shù)結(jié)構(gòu)已經(jīng)發(fā)生了變化——有人能使用飛槳可視化界面開發(fā),有人能使用場景化套件,一些人甚至擁有了應(yīng)用配置化開發(fā)的算法類套件深入進(jìn)行深度學(xué)習(xí)算法的開發(fā)的能力,而這支團(tuán)隊的成長,就是處在AI工作坊階段并不斷進(jìn)階的一個AI團(tuán)隊的縮影。

但這,也不過是飛槳的探險之旅中的一個環(huán)節(jié)。

3

乘上星際飛船,探索AI宇宙

說起AI進(jìn)入工業(yè)大生產(chǎn),人們一定非常興奮,腦中一定會出現(xiàn)非常壯麗的圖景,但在實際落地中,這種工作的組織難度是非常高的。

以一個大型的互聯(lián)網(wǎng)企業(yè)為例, 有涉及視覺、語音、推薦等數(shù)百個AI場景建模的需求,有應(yīng)用開發(fā)、算法調(diào)優(yōu)、平臺開發(fā)等多種類型的AI研發(fā)工作,有MPI、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等數(shù)千并發(fā)任務(wù),整個企業(yè)用了近十年向AI底座遷移,這才是真正的工業(yè)大生產(chǎn)。

而參與項目的技術(shù)人員、使用這些服務(wù)的企業(yè)員工,數(shù)量高達(dá)數(shù)千;在資源上,這些任務(wù)需要GPU、CPU、FGPA等異構(gòu)計算的數(shù)萬張卡,可謂是波瀾壯闊。

“這種多人多任務(wù)高并發(fā)度協(xié)同,是最考驗平臺能力的,因為它不僅是一個工程問題,更是一個工程管理問題,它考驗飛槳能否幫助AI在一個龐大體系落地的能力和效率,這是目前步入AI工業(yè)大生產(chǎn)的‘入門考試’!痹谝淮喂_論壇中,吳甜這樣形容。

而面對這樣復(fù)雜的需求,飛槳開展了兩方面的核心工作來支持,一類是面向資源算力層面,項目需要高效的算力管理與調(diào)度,以應(yīng)對大規(guī)模AI應(yīng)用時需要的算力基礎(chǔ)設(shè)施提供、管理、調(diào)度等。

為此,飛槳構(gòu)建了作業(yè)及工作流調(diào)度系統(tǒng),從這個角度來看,再次顯現(xiàn)了飛槳的“產(chǎn)業(yè)級”特性,那就是能夠支持大量并行任務(wù)同時開展,對模型和服務(wù)進(jìn)行了科學(xué)有序的管理,提升整體的研發(fā)效率。

這樣的大型項目中,很多都是基于人工智能的通用模型打造,而一般來說,打造一個通用模型直到它成熟,需要許許多多次的嘗試——很多通用模型在設(shè)計的時候其實都是一次對于資源的冒險,需要調(diào)動成千上萬的GPU。

而飛槳在這樣的大場景中解決的,就常常包含去嘗試不同的超大模型,并通過卓越的泛化能力,再產(chǎn)生出更多個適用不同場景的更優(yōu)化的小模型,我們可以把飛槳看做是“用AI生產(chǎn)出AI的體系”,它是AI的工作母機(jī),是人類探索AI的星際飛船。

而正是因為飛槳不斷的嘗試這樣的大場景、通用模型和泛化,所以,對于飛槳產(chǎn)品(模型)已經(jīng)完善的場景,或者有一定研發(fā)能力的企業(yè),企業(yè)中的AI團(tuán)隊在飛槳產(chǎn)品的輔助下就可以獨(dú)立完成很多出色的應(yīng)用項目,而且速度越來越快。

這其實就涉及到人們熱衷于討論的一個問題,對于越來越分散的場景,是不是需要無限的投入人力資源去定制服務(wù),答案顯然并非全部如此,飛槳的選擇就是通過不斷挑戰(zhàn)大場景,不斷的進(jìn)行模型優(yōu)化,使得模型的通用性越來越強(qiáng),再配合以各種專用的套件,就能不斷加速AI落地的速度。

例如,百度飛槳的合作伙伴里,就有專門生產(chǎn)AI產(chǎn)品及應(yīng)用解決方案的企業(yè),有一個企業(yè),就基于Paddle Detection目標(biāo)檢測套件中的YOLOv2算法,打造了適用于煉鋼廠的鋼坯位置的檢測方案。在這個項目中,由于PaddleDetection已經(jīng)趨于成熟,企業(yè)團(tuán)隊成員能力較強(qiáng),整體過程比較順利,基本沒遇到什么問題。而且,當(dāng)下次、下下次遇到類似的鋼坯檢測問題時,部署的速度會十倍、百倍的提升,這就是一個能夠用數(shù)據(jù)沉積智慧、經(jīng)驗和模型,從而不斷自我完善的閉環(huán),它們才是通向大工業(yè)時代真正的底層引擎。

如果說這篇文章僅僅是從AI落地的角度解讀AI從先行者階段向工業(yè)大生產(chǎn)時代的邁進(jìn),那它還是不夠全面的,因為AI落地不僅僅取決于以上的技術(shù)、工程、管理方面的要素,它還需要更大體系的支持。

其中,人才的培養(yǎng)是非常重要的。雖然我們看到,很多工程師都可以邊學(xué)邊干,在實踐中培養(yǎng)AI能力,但這不能掩蓋我國AI人才嚴(yán)重缺乏的現(xiàn)實。而且,這種缺乏是全面的,從開創(chuàng)性的領(lǐng)軍人物到最基層的用無代碼開發(fā)工具的應(yīng)用人才,都有巨大的缺口。

為此,飛槳非常重視復(fù)合型AI人才培養(yǎng)的工作,始終在輸出業(yè)務(wù)、算法、工程三位一體的人才培養(yǎng)理念,強(qiáng)調(diào)跨越邊界,學(xué)以致用。當(dāng)前已經(jīng)建立起成熟完善的產(chǎn)業(yè)級復(fù)合型AI人才培養(yǎng)體系,包括面向一線算法工程師的“AI快車道”,面向技術(shù)負(fù)責(zé)人的“AI私享會”和面向CTO、架構(gòu)師層級的“AICA首席AI架構(gòu)師培養(yǎng)計劃”等等。

生態(tài)的建立也至關(guān)重要。飛槳是一個平臺級的存在,平臺有平臺的優(yōu)勢,也有平臺的劣勢,特別是針對垂直場景和分散化的場景。

吳甜在多次對外溝通中反復(fù)強(qiáng)調(diào),AI落地應(yīng)用勢必是要面對分散化的場景需求,如何在業(yè)務(wù)場景中發(fā)現(xiàn)問題、解決問題需要懂得業(yè)務(wù)邏輯的人學(xué)會結(jié)合AI技術(shù),飛槳豐富的產(chǎn)品體系能夠滿足不同要求和特點(diǎn)的使用者,例如前面提到的零代碼可視化界面客戶端、場景類開發(fā)套件、算法類開發(fā)套件、模型庫、深度學(xué)習(xí)框架。

此外,飛槳還提供了企業(yè)級的平臺型產(chǎn)品BML,發(fā)布了首個易被集成的云原生機(jī)器學(xué)習(xí)核心系統(tǒng)PaddleFlow,可以為企業(yè)的AI平臺開發(fā)者提供資源管理調(diào)度等核心能力,賦能更多細(xì)分場景和深度定制的AI平臺,同時解決企業(yè)AI研發(fā)協(xié)作效率的問題。

但從更長遠(yuǎn)的角度看,飛槳應(yīng)該有更多生態(tài)伙伴,就像我們前面提到的,為企業(yè)提供AI產(chǎn)品和方案的公司,基于飛槳進(jìn)行豐富多樣的AI生產(chǎn)創(chuàng)造,協(xié)同加速千行百業(yè)的智能化升級。

<上一頁  1  2  
聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號