訂閱
糾錯
加入自媒體

當瀕危野生動物開始被昇騰AI保護起來

2022-05-23 10:00
曾響鈴
關(guān)注

作者 | 曾響鈴

文 | 響鈴說

大量的野外拍攝照片需要專家人工識別并進行注釋,費時費力;

決策者可以很快決定該如何采取行動,但在這之前要花很長時間等待數(shù)據(jù)分析結(jié)果;

幫助行業(yè)專家和公益界人士更好地優(yōu)化保護方式的科學研究,常常因為野外圖像數(shù)據(jù)支撐還不夠?qū)е逻M展緩慢……

動物保護已經(jīng)成為人類共識,但在行動上卻因為數(shù)據(jù)處理和挖掘速度根不上而面臨種種尷尬。隨著渡渡鳥、大海雀、塔斯馬尼亞虎、西部黑犀牛等珍惜動物的滅絕,生態(tài)系統(tǒng)所面臨的潛在不利影響正在放大,強化動物保護的科研認知、加快實踐落地工作變得更加緊迫。

在這樣的大背景下,人工智能介入動物保護就變得順理成章,這些年從國內(nèi)到國外大量的公益組織與科技企業(yè)都在嘗試用AI推動與動物保護有關(guān)的圖像數(shù)據(jù)處理工作。

然而,對AI模型開發(fā)而言,瀕危野生動物保護與其他多數(shù)領(lǐng)域相比面臨十分復雜的挑戰(zhàn),高效的AI開發(fā)框架和專業(yè)的技術(shù)團隊支撐變得更加重要,在業(yè)內(nèi),已有相關(guān)的合作在開展,例如某自然保護機構(gòu)就與來自昇騰AI產(chǎn)業(yè)生態(tài)的昇思MindSpore開源社區(qū)合作,共同將AI 應用于生物多樣性保護場景。

這種合作,將推動照片識別流程的速度,節(jié)省人力和時間,并將野外相機抓拍到的珍貴動物數(shù)據(jù)更快地反饋到科研和保護工作當中,而其過程,也是克服動物保護領(lǐng)域的獨特挑戰(zhàn)。

數(shù)據(jù)端被“扎口”,AI動物保護在模型端承受更大壓力

經(jīng)過數(shù)年積淀,立足自主AI計算架構(gòu)的昇騰AI產(chǎn)業(yè)生態(tài)已經(jīng)度過原始的積累期,在生態(tài)伙伴、行業(yè)場景等方面不斷突破,推動著千行百業(yè)的智能化升級,F(xiàn)在,昇騰以昇思MindSpore開源社區(qū)進入公益領(lǐng)域并不令人意外。

而無論與誰合作、服務于誰,昇騰AI產(chǎn)業(yè)要“搞定”一個場景往往需要針對性的合作模式與技術(shù)創(chuàng)新——在與上述自然保護機構(gòu)的合作中,AI參與動物保護就面臨獨特的訓練數(shù)據(jù)挑戰(zhàn)。

從官方公布的信息看,雙方首期投入作為訓練集的數(shù)據(jù)主要來自上述自然保護機構(gòu)與其他合作機構(gòu)從2011開始所積累的野外紅外相機數(shù)據(jù),一共12680 張照片,其中12180 張作為訓練集,500 張作為驗證集。

這些照片來支撐一個AI模型的開發(fā),面臨兩個問題:

一是數(shù)據(jù)總量“不上不下”,上萬張照片用人工去分析、挖掘數(shù)據(jù)耗時費力,但對AI來說又似乎并不充裕,尤其是照片還分為了雪豹、巖羊、白唇鹿等常見的 10 個物種或物種類別,進一步“稀釋”了數(shù)據(jù)的垂直度,而照片數(shù)據(jù)的獲取與增長本身還受限于采集條件;

二是數(shù)據(jù)質(zhì)量不佳,部署于野外的紅外相機所獲取的圖像往往難以清晰、完整,模糊的身影、與周邊環(huán)境難以區(qū)分等問題常常出現(xiàn)。

這就形成了一個尷尬的邏輯鏈條:一個動物越瀕危,其保護就越重要,AI越是應當參與進來,但是,能夠獲取到的圖像數(shù)量和質(zhì)量往往也越差,又給AI帶來了更大的挑戰(zhàn),即“越重要就越困難”。

于是,一個AI模型開發(fā)所主要關(guān)注的兩個環(huán)節(jié)——數(shù)據(jù)和算法,隨著數(shù)據(jù)端被“扎口”,壓力就更大程度上來到了算法開發(fā)上。而且,由于很多圖片本身即便是人工識別也有一定難度。

這又對AI模型的能力提出了其他領(lǐng)域少見的“超越人眼而不是追平人眼”的要求。一邊是數(shù)據(jù)受限,另一邊是對效果有高期許,動物保護領(lǐng)域的AI模型開發(fā)“兩頭承壓”,也就對開發(fā)框架提出了更高的支撐要求。

成為國內(nèi)首個參與動物保護的AI開發(fā)框架,Mindspore的探索不僅限于技術(shù)

昇騰與自然保護機構(gòu)的合作,讓昇思Mindspore成為國內(nèi)首個參與動物保護的AI開發(fā)框架,而為了應對上述挑戰(zhàn),可以認為,此次合作中昇騰除了技術(shù)本身,還在合作模式上做了探索。

首先,是既然“數(shù)據(jù)采集”(原始數(shù)據(jù)獲。┦芟蓿敲淳筒粩嗵嵘龑(shù)據(jù)的“珍視度”,在“數(shù)據(jù)標注”(用標注框框出照片中的識別對象的位置)階段發(fā)力。

一般而言,用于AI模型訓練的數(shù)據(jù)往往都是通過“勞動密集”的標注工作來輸出,目前較少有前沿技術(shù)和專業(yè)人士的參與。而此次合作,昇思MindSpore 團隊線上指導了自然保護機構(gòu)團隊使用AI標注平臺開展物種標注工作,并后續(xù)邀請了 61 位志愿者來一同進行數(shù)據(jù)標注——準確標注的數(shù)據(jù)再去“喂養(yǎng)”AI模型,將直接提升模型訓練的效果。

然后,是通過權(quán)衡取舍確定最佳的算法路徑,不迷信于單一類別的基礎模型,而是根據(jù)實際情況結(jié)合AI開放框架的創(chuàng)新綜合考慮。

針對經(jīng)典的one-stage模型精度低但速度快,而two-stage模型精度高但速度慢的現(xiàn)實,昇思MindSpore 開源運營團隊和自然保護機構(gòu)討論后采用了YOLOv3 目標檢測模型,其歸屬于one-stage但同時得益于昇思MindSpore的創(chuàng)新開發(fā)能夠平衡檢測的質(zhì)量和速度,能在效率的基礎上保證識別的效果。

再有,是以開源推進的方式讓公益領(lǐng)域的AI也能群策群力。

本次合作的所有代碼、模型文件和部署文檔均已在昇思MindSpore社區(qū)開源,大量的開發(fā)者參與其中,為模型的優(yōu)化做出貢獻,更好地應對動物保護領(lǐng)域的獨特挑戰(zhàn)。而模型被開源后也不單服務于上述自然保護機構(gòu)一家機構(gòu),還能夠幫助到更多需要的人和機構(gòu),發(fā)揮出更大的價值。群策群力、群體價值共享的開源社區(qū)基礎愿景在公益領(lǐng)域得到踐行。

最后,是公益組織與科技平臺進行了“初創(chuàng)式”的合作模式探索。

在直觀上,是自然保護機構(gòu)與昇思MindSpore探索了一套從需求出發(fā)的緊密協(xié)作機制,可以往其他公益機構(gòu)、領(lǐng)域進行復制。

而內(nèi)里,是開源模式在公益領(lǐng)域的有效落地。在環(huán)保已經(jīng)成為普遍共識的今天,通過技術(shù)的手段來強化公益工作已經(jīng)是許多公益組織的必選項,公益組織與商業(yè)組織一樣在積極擁抱AI,擁抱能夠加深AI技術(shù)廣度與深度的開源打法。華為當然十分有意愿加入到公益事業(yè)當中,發(fā)揮自身技術(shù)和業(yè)務沉淀的價值,而更應該強調(diào)的是,它作為昇思MindSpore 開源社區(qū)的一員,也是通過開源社區(qū)在貢獻自己的力量,努力推進優(yōu)質(zhì)識別模型的發(fā)展。

開源時代,AI社區(qū)“社會意義”的一面正在不斷強化

從自然保護機構(gòu)與昇思MindSpore開源社區(qū)的合作不難看出,作為一種推動“技術(shù)進步”的模式存在,開源的打法不負眾望,幫助了AI識別模型的不斷優(yōu)化并分享給了更多人。

而從另一個角度看,通過開源的方式,很多希望為公益出一份力的開發(fā)者有了新的抵達路徑,在捐錢、捐物、抵制珍惜動植物消費等做法之外,能夠?qū)⒓夹g(shù)的力量通過社區(qū)貢獻注入到公益工作當中去,也許未來某一次的雪豹保護工作中所采用過的AI識別應用就有自己所貢獻的技術(shù)的痕跡,這是不可否認且能夠長期發(fā)揮價值的公益舉動。

自2020 年 3 月正式開源以來,兩年時間過去,昇思MindSpore社區(qū)已擁有 80 萬社區(qū)開發(fā)者,下載量超過 166 萬,5000+企業(yè)應用上線,認證開發(fā)者/布道師近300人,社區(qū)貢獻者4500+,成為了國內(nèi)第一熱度的 AI 開源社區(qū)。參與公益合作,讓快速發(fā)展的昇思MindSpore展示了AI社區(qū)在推動“技術(shù)進步”之外更能推動“社會進步”的意義,社區(qū)越是繁榮,能夠吸引到參與公益的開發(fā)者就越是廣泛,公益事業(yè)也就有了更好的技術(shù)支撐和保障。

而昇思MindSpore開源社區(qū)與上述自然保護機構(gòu)聯(lián)合成立的AI for Biodiversity Conservation Working Group(簡稱:WG-AI4BC)就是基于此目的,以常態(tài)化合作機制匯聚更多的社會力量,強化人工智能技術(shù)研究,幫助尋找、保護中華水塔中的珍惜野生動植物。

就在520當天,華為官方公眾號還發(fā)布了關(guān)注昇騰AI(喻為“愛”)幫助世界更美好的推文(見文末鏈接),其中首先提到了利用昇騰AI保護雪豹,可見AI參與動物保護正在以凸顯人文關(guān)懷的方式來獲得更廣泛的關(guān)注和參與——本文的撰寫就一定程度上受到了這種人文關(guān)懷的推動。

現(xiàn)在,WG-AI4BC還在邀請更多開發(fā)者參與,在查閱立項文檔后,開發(fā)者可以選擇通過在社區(qū)提交ISSUE或者PR的方式參與到開源貢獻當中來,或者直接通過 naturewatch@shanshui.org提交提案。

回過頭來看,昇思MindSpore開源社區(qū)所匯聚的行業(yè)、科研及開源力量,已經(jīng)推動了醫(yī)療、交通、金融、互聯(lián)網(wǎng)、制造、能源、運營商等8大行業(yè)的智能化變革,幫助昇騰AI與產(chǎn)業(yè)的融合深度不斷加深,千行百業(yè)的產(chǎn)業(yè)智能化升級既有了高效可靠的底層AI基礎設施,也有了全面業(yè)務助力的AI使能者。

隨著昇思MindSpore開源社區(qū)開始往公益領(lǐng)域深入,昇騰AI產(chǎn)業(yè)生態(tài)將增添又一個重要的垂直領(lǐng)域,AI在公益領(lǐng)域的落地表現(xiàn)將更值得期待。

*本文圖片均來源于網(wǎng)絡

       原文標題 : 當瀕危野生動物開始被昇騰AI保護起來

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號