華為ai系列研究:昇騰的Atlas 800訓練服務器
上一篇了解到華為昇騰的Atlas 500智能小站,今天學習一下華為昇騰的Atlas 800訓練服務器。大家發(fā)現(xiàn)沒?越往后研究越是高級的產(chǎn)品。
Atlas 800 訓練服務器(型號:9000)是基于華為鯤鵬920+昇騰910處理器的AI訓練服務器,具有最強算力密度、超高能效與高速網(wǎng)絡帶寬等特點。該服務器廣泛應用于深度學習模型開發(fā)和訓練,適用于智慧城市、智慧醫(yī)療、天文探索、石油勘探等需要大算力的行業(yè)領域。
這里面非常關鍵的一個信息是,AI處理器從昇騰310換成了昇騰910,這也是算力的增強。我們就先說一下310和910的區(qū)別。
昇騰310:昇騰310是一款高效、靈活、可編程的AI處理器;诘湫团渲,八位整數(shù)精度(INT8)下的性能達到22TOPS,16位浮點數(shù)(FP16)下的性能達到11 TFLOPS,而其功耗僅為8W。昇騰310芯片采用華為自研的達芬奇架構,集成了豐富的計算單元,在各個領域得到廣泛應用。隨著全AI業(yè)務流程的加速,昇騰310芯片能夠使智能系統(tǒng)的性能大幅提升,部署成本大幅降低。
昇騰310在功耗和計算能力等方面突破了傳統(tǒng)設計的約束。隨著能效比的大幅提升,昇騰310將人工智能從數(shù)據(jù)中心延伸到邊緣設備,為平安城市、自動駕駛、云服務和IT智能、智能制造、機器人等應用場景提供了全新的解決方案,使能智慧未來。
圖片來自華為官網(wǎng)
昇騰910 AI處理器:昇騰910是一款具有超高算力的AI處理器,其最大功耗為310W,華為自研的達芬奇架構大大提升了其能效比。八位整數(shù)精度(INT8)下的性能達到640TOPS,16位浮點數(shù)(FP16)下的性能達到320 TFLOPS。
作為一款高集成度的片上系統(tǒng)(SoC),除了基于達芬奇架構的AI核外,昇騰910還集成了多個CPU、DVPP和任務調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢。
昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構建橫向擴展(Scale Out)和縱向擴展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口,片內(nèi)RoCE可用于節(jié)點間直接互聯(lián)。最新的PCIe 4.0的吞吐量比上一代提升一倍。
圖片來自華為官網(wǎng)
通過兩款芯片的對比,它們的主要區(qū)別是算力大小以及算力管理能力,大算力者可以做訓練服務器。研究完主芯片之后,我們再回到Atlas 800 訓練服務器,它用又分風冷和液冷兩種:
圖片來自華為官網(wǎng)
它的外形如下圖:
圖片來自華為官網(wǎng)
產(chǎn)品規(guī)格表
更多研究,請參考鏈接:華為800。接下來的每周研究,將會對使用場景進行深入研究,包括應用的生態(tài),華為是大廠中做生態(tài)做得最好的公司了,敬請期待。
免責聲明:
本公眾號為個人研究專題學習分享,非商業(yè)公眾號無任何商業(yè)目的,如果文章內(nèi)容有侵權或者非法信息,請立即與本號聯(lián)系刪除謝謝

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?